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内 容 提 要 


本 书 通过 循序 渐进 的 方式 ， 从 最 基础 的 概念 到 高 级 别 的 Ruby 3 
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再 到 更 


复杂 的 应 用 ， 提 供 了 开发 成 熟 且 功能 强大 的 应 用 程序 所 必 备 的 知识 和 技巧 ， 帮 助 读 者 
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套 接 字 (socket) 连接 起 了 数字 世界 。 


回想 一 下 计算 机 的 早年 吧 。 那 时 候 它 是 专 供 科学 家 使 用 的 噩 物 , 他 们 
用 它 来 做 数学 运算 以 及 模拟 ， 那 真是 阳春 白雪 的 东西 啊 。 


计算 机 真正 将 普通 人 相互 联系 起 来 , 已 经 是 多 年 之 后 的 事 了 。 如 今 ， 
计算 机 更 多 是 由 普罗 大 众 在 使 用 , 科学 家 占 的 比例 很 小 。 人 们 能 够 
随时 随地 同 他 人 共享 信息 、 互 相交 流 ， 计 算 机 就 越发 变 得 引 人 
入 胜 。 





正 是 网 络 编程 一 一 更 确切 地 说 ， 是 一 组 特定 的 套 接 字 编程 API 一 一 
的 出 现 , 才 使 得 这 一 切 成 真 。 正 在 阅读 本 书 的 你 可 能 每 天 都 同 他 人 
进行 在 线 联系 ,每 天 都 在 使 用 这 些 由 计算 机 互联 的 想法 所 催生 的 
技术 。 

















所 以 说 网 络 编程 归根 结 底 是 关于 共享 与 通信 的 。 本 书 的 目的 在 于 使 你 
更 深入 地 理解 网 络 编程 的 底层 机 制 ， 为 网 络 互联 贡献 出 自己 的 一 份 
力量 。 
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我 的 故事 





我 仍 记 得 与 套 接 字 初次 相遇 时 的 情景 。 嗯 ， 那 可 实在 算 不 上 美好 。 


作为 Web 开 发 人 员 ， 我 使 用 过 各 种 HITP API， 也 已 经 习惯 了 诸如 
REST、JSON 这 类 高 层 概念 。 


后 来 ， 我 不 得 不 去 集成 一 个 域名 注册 API。 


我 拿 到 API 文 档 就 蒙 了 。 文 档 中 要 求 在 某 些 私有 主机 名 的 随机 端口 上 
打开 一 个 TCP 套 接 字 。 这 和 Twitter API 的 工作 方式 一 点 都 不 一 样 ! 








文档 不 仅 要 求 建立 TCP 套 接 字 ， 而 且 并 没有 将 数据 编码 为 ON ， 甚 

至 连 XML 都 不 是 。 我 必须 使 用 它们 自己 的 那 一 套 基 于 行 的 协议 (line 
protocol )。 通 过 套 接 字 发 送 专 门 格式 化 过 的 文本 行 ， 然 后 发 送 一 个 空 
行 ， 接 着 是 用 于 参数 的 一 对 键 - 值 ， 最 后 跟 上 两 个 空 行 表明 请 求 发送 


完毕 。 





随后 还 得 用 同样 的 方式 读 入 响应 的 内 容 。 当 时 我 就 在 想 :“ 这 搞 的 是 
哪 出 啊 .…… " 


我 把 这 些 东西 拿 给 了 我 的 同事 看 ,他 的 反应 和 我 一 样 。 他 也 从 来 没 用 
过 这 种 API。 他 立刻 提醒 我 道 :“ 我 以 前 只 在 C 语 言 中 用 过 套 接 字 。 你 
可 得 小 心 点 。 在 退出 前 一 定 得 把 套 接 字 关 闭 , 不 然 它 就 会 一 直 处 于 打 
开 状 态 。 程 序 退 出 后 ， 就 很 难 将 其 关闭 了 。” 

















什么 ?! 一 直 打 开 ? WN? mA? 我 异 了 。 


后 来 另 一 位 同事 看 了 一 眼 ， 然 后 说 :“ 不 是 真 的 吧 ? 你 不 知道 怎么 用 
套 接 字 ?要 知道 每 次 读 取 Web 页 面 时 ， 就 是 在 使 用 套 接 字 啊 。 你 真 应 
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该 了 解 一 下 它 的 工作 原理 。 





我 将 此 视 为 一 次 挑战 。 一 下 子 理 清 这 些 概 念 实在 有 些 吃 不 消 , 不 过 我 
也 要 全 力 以 赴 。 尽管 没 少 出 错 , 但 最 终 还 是 把 它 搞定 了 。 就 套 接 字 而 
A, 我 对 它 的 运用 比 以 前 更 上 了 一 层 楼 。 对 于 工作 中 所 依赖 的 那些 技 
术 也 有 了 更 深入 的 理解 。 这 种 感觉 还 真是 不 错 。 





车 助 于 本 书 , 我 希望 能 够 帮 你 减少 一 些 我 自己 在 初 识 套 接 字 时 所 经 历 
的 烦恼 ， 同 时 让 你 在 深刻 领悟 这 一 系列 技术 后 享受 到 神 清 气 更 的 








本 书 的 读者 对 象 


这 本 书 的 日 标 读者 是 工作 在 Unix 或 类 Unix 系 统 平台 上 的 Ruby 开 发 
人 员 。 


本 书 的 读者 应 该 熟悉 Ruby, 但 不 必 和 掌握 网 络 编程 的 相关 概念 , 我 会 从 
网 络 编程 的 基础 讲 起 。 


本 书 所 有 实例 代码 使 用 Ruby 1.9 编 写 ， 并 没有 在 更 早 的 版 本 上 测 
试 过 。 


本 书 的 内 容 


本 书包 括 三 个 主要 部 分 。 


第 一 部 分 介绍 套 接 字 编程 的 基础 知识 。 你 可 以 学 到 如 何 创建 套 接 凶 ， 
如 何 连 接 套 接 字 以 及 如 何 共 享 数据 。 
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第 二 部 分 阐述 一 些 套 接 字 编程 的 高 级 主题 。 在 你 学 会 了 “Hello world" 
式 的 套 接 字 编程 之 后 ， 还 需要 掌握 这 些 内 容 。 





第 三 部 分 在 真实 场景 中 运用 前 两 部 分 中 学 到 的 知识 。 这 部 分 会 教 你 如 
何在 网 络 程序 中 使 用 并 发 技术 。 对 于 同一 个 问题 , 我 们 会 采用 多 个 架 
构 模 式 解 决 ， 并 对 这 些 模 式 进 行 比较 。 


Berkeley 套 接 字 API 
本 书 主要 关注 的 是 Berkeley 套 接 字 API 及 其 用 法 。Berkeley 套 接 字 API 


最 先 于 1983 年 出 现在 BSD 操 作 系统 4.2 版 本 中 。 该 操作 系统 是 当时 刚刚 
提出 的 TCP 的 首 个 实现 。 














Berkeley 套 接 字 API 真 正经 受 住 了 时 间 的 检验 。 本 书 中 所 使 用 的 API 和 
被 大 多 数 现 代 编 程 语 言 所 支持 的 API 同 1983 年 时 的 那 套 API 如 出 一 
Tit. 








毫 无 疑问 ，Berkeley 套 接 字 API 之 所 以 能 够 屹立 不 倒 的 一 个 关键 原因 
就 是 : 你 可 以 在 无 需 了 解 底 层 协议 的 情况 下 使 用 套 接 字 。 这 一 点 至 关 
重要 ， 我 们 会 在 后 面 详细 探讨 。 





Berkeley 套 接 字 API 是 一 种 编程 API， 运 作 在 实际 的 协议 实现 之 上 。 
它 关 注 的 是 连接 两 个 端点 ( endpoint ) 共享 数据 ， 而 非 处 理 分 组 和 序 
列 号 。 














已 成 业界 标准 的 Berkeley 套 接 字 API 是 由 C 语 言 实 现 的 ， 几 乎 所 有 用 C 
编写 的 现代 编程 语言 都 会 包含 它 的 低层 次 接口 。 因此, 我 尽力 使 本 书 
的 大 部 分 内 容 具有 普 适 性 。 
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也 就 是 说 ， 我 并 不 是 仅仅 演示 Ruby 所 提供 的 套 接 字 API 的 包装 类 
(wrapper class )， 而 是 先 讲解 低层 次 的 API， 然 后 再 介绍 Ruby 的 包装 
类 ， 使 你 对 套 接 字 的 理解 不 仅仅 局 限 在 Ruby 中 。 














当 使 用 其 他 的 编程 语言 时 ， 你 仍然 可 以 运用 这 里 所 学 到 的 基础 知识 ， 
利用 低层 次 结构 实现 所 需要 的 一 切 。 


本 书 没有 讲述 的 内 容 





之 前 我 提 到 过 Berkeley 套 接 字 API 的 优点 就 是 你 无 需 了 解 任何 底层 协 
议 的 细节 。 本 书 也 会 彻底 贯彻 这 一 点 。 





有 些 有 关 网 络 互 联 的 书籍 重点 关注 底层 协议 及 其 错综复杂 的 细节 , 其 
至 会 在 诸如 UDP 协 议 或 是 原始 套 接 字 上 重新 实现 TCP。 本 书 可 不 会 讲 




















我 们 采纳 了 Berkeley 套 接 字 API 所 奉行 的 观点 ， 即 使 用 者 无 需 了 解 底 
层 协 议 的 实现 。 本 书 将 重点 放 在 如 何 使 用 API 实 现 有 用 的 功能 ， 并 尽 
可 能 关注 如 何 完 成 实战 任务 。 


不 过 有 时 候 (例如 从 事 性 能 优化 )， 不够 了 解 底层 协议 会 使 你 无 法 正 
确 地 使 用 某 种 特性 。 这 种 情况 下 ,我 会 解释 一 些 必 要 的 细节 ， 以 帮助 
你 理解 某 些 概念 。 


将 话题 再 转 回 到 协议 上 。 我 已 经 说 过 不 会 详细 讨论 TCP， 同 样 也 不 会 
详细 介绍 其 他 诸如 HITP、FTP 等 应 用 层 协议 。 在 随后 的 章节 中 ,我 
会 在 示例 中 用 到 一 些 协议 , 但 并 不 会 深入 探讨 它们 。 
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如 果 你 对 协议 感 兴 趣 ， 我 推荐 Stevens 的 著作 《TCP/P 详 解 》( TCP/IP 
Illustrated ) ", 


netcat 


书 中 有 很 多 地 方 都 使 用 netcat 工 具 创建 了 一 些 随意 的 连接 , 用 来 测试 
我 们 编写 的 各 色 程 序 。 netcat( 在 终端 下 通常 是 nc ) 是 一 个 Unix 工 具 ， 
可 以 用 于 创建 TCP (以 及 UDP ) 连接 并 进行 侦 听 。 在 使 用 套 接 字 时 ， 
它 可 是 你 工具 箱 中 必 备 的 一 件 利 器 。 











如 果 你 的 工作 平台 是 Unix 系 统 , 那么 netcat 可 能 已 经 安装 好 了 , 运行 
本 书 的 示例 应 该 不 会 磁 上 什么 问题 。 
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让 我 们 结合 例子 开始 套 接 字 的 学 习 之 旅 吧 。 


1.4. Ruby 的 套 接 字库 








Ruby 的 套 接 字 类 在 默认 情况 下 并 不 会 被 载 人 ， 它 需要 使 用 require 
'socket' 导 和信。 其 中 包括 了 各 种 用 于 TCP 套 接 字 、UDP 套 接 字 的 类 ， 
以 及 必要 的 基本 类 型 。 在 本 书 中 你 会 看 到 其 中 的 部 分 内 容 。 

















socket 库 是 Ruby 标 准 库 的 组 成 部 分 。 同 openssl、zlib 及 curses 
这 些 库 类 似 ，socket 库 与 其 所 依赖 的 C 语 言 库 之 间 是 thin binding 
关系 ，socket 库 在 多 个 Ruby 发 布 版 中 一 直 都 很 稳定 。 





在 创建 套 接 字 之 前 不 要 忘记 使 用 require 'socket'。 


1.2 创建 首 个 套 接 字 














记 住 我 之 前 的 提醒 ， 接 下 来 让 我 们 着 手 创建 一 个 套 接 字 。 
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X ./code/snippets/create. socket. rb 
require 'socket' 


Socket = Socket.new(Socket::AF. INET, Socket: :SOCK STREAM) 





上 面 的 代码 在 INET 域 创建 了 一 个 类 型 为 STREAM 的 套 接 字 。INET 是 
internet 的 缩写 ， 特 别 用 于 指 代 IPv4 版 本 的 套 接 字 。 





STREAM 表 示 将 使 用 数据 流 进行 通信 , 该 功能 由 TCP 提 供 。 如 果 你 指定 
的 是 DGRAM ( datagram 的 缩写 ， 数 据 报 )， 则 表示 UDP 套 接 字 。 套 接 字 
的 类 型 用 来 告诉 内 核 需要 创建 什么 样 的 套 接 字 。 























1.3 ”什么 是 端点 


在 谈 到 IPv4 的 时 候 ， 我 提 到 了 几 个 新 名 词 。 继 续 新 的 内 容 之 前 ， 让 我 
们 先 学 习 一 下 IPv4 和 寻 址 。 











在 两 个 套 接 字 之 间 进 行 通信 , 就 需要 知道 如 何 找 到 对 方 。 这 很 像 是 打 
电话 : 如 果 你 想 和 某 人 进行 电话 交流 ， 必 须知 道 对 方 的 电话 号 码 。 








套 接 字 使 用 IP 地 址 将 消息 指向 特定 的 主机 。 主 机 由 唯一 的 人 PP 地址 来 标 
识 ，IP 地 址 就 是 主机 的 “电话 号 码 ”。 


上 面 我 特别 提 到 了 IPv4 地 址 。IPv4 地 址 通常 看 起 来 像 这 样 : 
192.168.0.1. 它 是 由 点 号 相连 接 的 4 个 小 于 等 于 255 的 数字 。 这 东西 
能 做 什么 ”配置 了 IP 地 址 的 主机 可 以 向 男 一 台 同 样 配 置 了 LP 地 址 的 
主机 发 送 数 据 。 
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IP 地 址 电话 得 
你 知道 想 要 与 之 对 话 的 主机 的 地 址 后 ， 就 很 容易 想象 套 接 字 通信 
了 ， 但 是 怎样 才能 获取 到 那个 地 址 呢 ? 需要 把 它 背 下 来 吗 ， 还 是 
写 在 纸 上 ? 谢 天 谢 地 ， 都 不 需要 


wl 


四 


pa m uc e 
系统 。 有 了 它 ， 你 就 无 需 记 忆 主 机 的 地 址 ， 不 过 得 记 住 它 的 名 字 。 
随后 可 以 让 DNS 将 主机 名 解析 成 地 址 。 即 便 是 地 址 发 生 了 变动 ， 
主机 名 总 是 能 够 将 你 引 向 正确 的 位 置 。 真 棒 ! 


1.4 环 回 地 址 





耳 地 址 未 必 总 是 指向 远 端 主机 。 尤 其 是 在 研发 阶段 ， 你 通常 需要 连接 
自己 本 地 主机 上 的 套 接 字 。 





多 数 系统 都 定义 了 环 回 接口 (loopback interface )。 和 网 卡 接口 不 同 ， 
这 是 一 个 和 硬件 无 关 、 完 全 虚拟 的 接口 。 发 送 到 环 回 接口 上 的 数据 立 
即 会 在 同一 个 接口 上 被 接收 。 配 合 环 回 地 址 , 你 就 可 以 将 网 络 搭 建 在 
本 地 主机 中 。 





环 回 接口 对 应 的 主机 名 是 localhost ， 对 应 的 全 地 址 通 
127.0.0.1。 这 些 都 定义 在 系统 的 hosts 文 件 中 。 


1.5 IPv6 


我 说 起 过 儿 次 IPv4， 但 是 并 没有 提 过 IPv6。IPv6 是 男 一 种 IP 地 址 寻 址 
方案 
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干 嘛 要 有 两 种 寻 址 方案 ? 因为 IPv4 地 址 已 经 用 完了 。"IPv4 由 4 组 数字 
组 成 ， 各 自 的 范围 在 0 ~ 255。 每 一 组 数字 可 以 用 8 位 二 进 制 数字 来 表 
示 , 合计 共 需 32 位 二 进 制 。 这 意味 着 有 2” 或 43 亿 个 地 址 。 这 是 个 不 小 
的 数字 , 不 过 想象 一 下 你 每 天 看 到 有 多 少 接 入 网 络 的 设备 …… 就 不 会 
惊讶 于 卫 地 址 的 枯竭 了 。 








今天 IPv6 地 址 空间 看 起 来 非常 大 ， 不 过 随 着 IPv4 地 址 逐渐 耗 尽 ，IPv6 
一 定 会 越 来 越 重要 。IPv6 采 用 了 一 种 不 同 的 格式 , 可 以 拥有 天 文 数字 
级 别 的 独立 PP 地址 。 


不 过 大 部 分 时 间 你 无 需 手动 输入 这 些 地 址 ， 无 论 使 用 哪 种 寻 址 方案 ， 
结果 都 一 样 。 


1.6 端口 


对 于 端点 而 言 ， 还 有 另外 一 个 重要 的 方面 一 一 端口 号 。 继 续 我 们 那 
个 电话 的 例子 : 如 果 你 要 和 办 公 楼 中 的 某 人 进行 通话 ， 就 得 拨 通 他 
们 的 电话 号 码 ， 然 后 再 拨 分 机 号 。 端 口号 就 是 套 接 字 端点 的 “分 
BL. 














对 于 每 个 套 接 字 而 言 ，IP 地 址 和 端口 号 的 组 合 必须 是 唯一 的 。 所 以 
在 同一 个 侦 听 端口 上 可 以 有 两 个 套 接 字 ， 一 个 使 用 IPv4 地 址 ， 另 一 
个 使 用 IPv6 地 址 ， 但 是 这 两 个 套 接 字 不 能 都 使 用 同一 个 IPv4 
地 址 。 











(D http://www.nro.net/news/ipv4-free-pool-depleted. 
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若 没有 端口 号 ， 一 台 主 机 一 次 只 能 够 文 持 一 个 套 接 字 。 将 每 个 活动 
套 接 字 与 特定 的 端口 号 结合 起 来 ， 主 机 便 可 以 同时 支持 上 千 个 套 
接 字 。 





X 











我 该 使 用 哪个 端口 号 ? 
DNS 没 法 解决 这 个 问题 ， 不 过 我 们 可 以 借助 已 明确 定义 的 端口 号 
列表 。 


例如 ，HTTP 上 默认 在 端口 80 上 进行 通信 ，FTP 的 端口 是 21。 实 际 上 
有 一 个 组 织 负责 维护 这 个 列表 。" 在 下 一 章 会 用 到 更 多 的 端口 号 。 


1.7 创建 第 二 个 套 接 字 


现在 让 我 们 来 尝 点 Ruby 提 供 的 语法 糖 (syntactic sugar )。 


尽管 就 创建 套 接 字 来 说 , 有 很 多 更 高 级 别 的 抽象 , 但 Ruby 可 以 让 你 使 
用 符号 ( 而 非常 量 ) 来 描述 各 种 选项 。 因 此 你 可 以 用 :INET 和 :STREAM 
分 别 描述 Socket: :AF_INET 以 及 Socket: :SOCK_ STREAM。 下 面 是 一 
个 在 IPv6 域 中 创建 TCP 套 接 字 的 示例 : 








X ./code/snippets/create. socket memoized.rb 
require 'socket' 


Socket = Socket.new(:INET6, :STREAM) 

















这 段 代 码 创建 了 一 个 套 接 字 , 不 过 还 不 能 同 其 他 套 接 字 交换 数据 。 下 
一 章 我 们 会 看 到 如 何 使 用 类 似 的 套 接 字 完成 实际 的 工作 。 











(D http:/www.iana.org/. 
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套 接 字 


1.8 文档 


现在 该 讲 到 文档 了 。 从 事 套 接 字 编程 的 一 件 妙 事 就 是 系统 中 已 经 包含 
了 大 量 有 帮助 的 文档 。 可 以 查找 文档 的 地 方 主要 有 两 处 : (0) 手册 页 ; 


(2) ris 








面 是 简单 说 明 。 


(1) Unix 手 册页 提供 了 有 关 底 层 系统 函数 ( C 语 言 代码 ) 的 文档 ,Ruby 
的 套 接 字库 便 是 在 此 基础 上 构建 的 。 尽 管 手册 页 涉及 的 都 是 底层 





内 容 , 但 


是 可 以 让 你 了 解 某 个 系统 调用 的 作用 ,这 一 点 正 是 Ruby 


文档 所 欠缺 的 。 它 还 可 以 告诉 你 该 系统 调用 可 能 出 现 的 错误 代码 。 


例如 在 上 面 的 代码 中 , 我 们 使 用 了 Socket.new。 它 会 映射 到 系统 
函数 socket(), 该 函数 负责 创建 一 个 套 接 字 。 可 以 使 用 下 面 这 个 
fi 命令 来 查看 它 的 用 法 : 














$ man 2 socket 


注意 到 2 没 ” 这 告诉 man 程 序 查 看 手册 页 的 第 2 节 。 手 册页 被 划分 


RETE 


e 1: 


o 


一 般 命令 ( shell 程序 )。 


: 系统 调用 。 

: C 库 函数 。 

: 特殊 文件 。 

: 文件 格式 。 

: 提供 了 各 种 话题 的 综述 。tcp(7) 就 很 有 意思 。 
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我 会 使 用 这 样 的 语法 引用 手册 页 : socket(2)。 它 引用 的 是 socket 
手册 页 的 第 2 节 。 这 样 的 语法 是 很 有 必要 的 , 因为 一 些 手册 页 存在 
于 多 个 节 之 中 ， 例 如 stat(1) 和 stat(2)。 





如 果 你 注意 到 socket(2) 中 “SEE ALSO” 这 部 分 ， 就 会 在 其 中 发 现 
一 些 我 们 将 要 讲 到 的 系统 调用 。 








fi 是 Ruby 命 令 行 文档 工具 。Ruby 安 装 程序 会 将 安装 核心 库 文档 作 
为 整个 安装 过 程 的 一 部 分 。 








Ruby 在 某 些 方面 缺乏 良好 的 文档 , 不 过 我 必须 要 说 的 是 套 接 字 库 
的 文档 相当 人 全面。 我们 可 以 使 用 下 面 的 命令 来 看 看 Socket .new 
的 ri 文档 


$ ri Socket.new 








ri 非常 有 用 而 且 不 需要 连接 互联 网 。 如 果 你 需要 指南 或 者 示例 ， 
它 是 不 错 的 。 


1.9 本 章 涉及 的 系统 调用 


每 一 章 都 会 列 出 新 介绍 的 系统 调用 ， 告 诉 你 如 何 使 用 ri 或 手册 页 来 获 


得 











其 更 多 的 信息 。 


DQ Socket.new 一 socket(2) 
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TCP 在 两 个 端点 之 间 建 立 连 接 。 端 点 可 能 处 于 同一 台 主 机 ， 也 可 能 位 
于 不 同 的 主机 中 。 不 管 是 哪 一 种 情况 ， 背 后 的 原理 都 是 一 样 的 。 

当 你 创建 套 接 字 时 ， 这 个 套 接 字 必须 担任 以 下 角色 之 一 : (1) 发 起 者 
( initiator ); (2) 侦 听 者 〈1listener )。 两 种 角色 必 不 可 少 。 少 了 侦 听 套 
接 字 , 就 无 法 发 起 连接 。 没 有 连接 的 发 起 者 , 也 就 没 必 要 进行 侦 听 了 。 














在 网 络 编程 中 ， 通 常 将 从 事 侦 听 的 套 接 字 称 作 “服务 器 ”， 将 发 起 连 
接 的 套 接 字 称 作 “客户 端 ”。 下 一 章 将 观察 它们 各 自 的 生命 周期 。 
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服务 礁 生 命 周期 








服务 器 套 接 字 用 于 侦 听 连接 而 非 发 起 连接 ， 其 典型 的 生命 周期 如 下 : 





(1) 创建 ; 
(2) 绑 定 ; 
(3) 侦 听 ; 
(4) 接受 ; 
(5) 关闭 。 
我 们 已 经 讲 过 了 “创建 "。 接 下 来 继续 讲解 余下 的 部 分 。 


3.1 服务 器 绑 定 


服务 器 生命 周期 中 的 第 二 步 是 绑 定 到 监听 连接 的 端口 上 。 


€ ./code/snippets/bind.rb 
require 'socket' 


# 首先 创建 一 个 新 的 TCP 套 接 字 。 
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10 %3% ”服务 器 生命 周期 





Socket = Socket.new(:INET, :STREAM) 


E 创建 一 个 C 结 构 体 来 保存 用 于 侦 听 的 地 址 。 
addr = Socket.pack sockaddr. in(4481, '0.0.0.0') 


E 执行 绑 定 。 
socket.bind(addr) 





这 是 一 个 低层 次 实现 ， 演 示 了 如 何 将 TCP 套 接 字 绑 定 到 本 地 端口 上 。 
实际 上 ， 它 和 用 于 实现 同样 功能 的 C 代 码 几 乎 一 模 一 样 。 











这 个 套 接 字 现 在 被 绑 定 到 本 地 主机 的 端口 4481 上 。 其 他 套 接 字 便 不 能 
再 使 用 此 端口 ， 否 则 会 产生 异常 Errno: :EADDRINUSE。 客 户 端 套 接 
字 可 以 使 用 该 端口 号 连接 服务 器 套 接 字 ， 并 建立 连接 。 








如 果 你 运行 上 面 的 代码 , 会 发 现 它 立刻 就 会 退出 。 这 些 代码 倒是 没 错 ， 
但 是 还 不 足以 侦 听 某 个 连接 。 接 着 往 下 阅读 ,看 看 如 何 将 服务 器 置 于 
侦 听 模式 。 








REACHES —38 , 服务 咒 需 要 绑 定 到 某 个 特定 的 、 双 方 商定 的 端口 号 上 ， 
客户 端 套 接 字 随后 会 连接 到 该 端口 。 











当然 了 ，Ruby 提 供 了 语法 上 的 便利 ， 你 无 需 直 接 使 用 Socket .pack_ 
sockaddr_in 或 Socket#bind。 不 过 在 学 习 这 些 语法 糖 之 前 ,我 们 很 
有 必要 避 易 就 难 地 看 看 这 一 切 是 如 何 实现 的 。 





3.1.4. 该 绑 定 到 哪个 端口 

这 对 于 每 一 个 编写 服务 器 的 程序 员 而 言 都 是 一 个 非常 重要 的 考量 。 应 
该 选择 随机 端口 吗 ? 该 如 何 知道 是 否 已 经 有 其 他 的 程序 将 某 个 端口 
ANCA? 








图 灵 社 区 会 员 Tiny9458 CF 尊重 版 权 





3.1 ”服务 器 绑 定 | 11 


任何 在 0~65 535 之 间 的 端口 都 可 以 使 用 ， 但 是 在 选用 之 前 别 忘 了 一 些 
重要 的 约定 。 


规则 1: 不 要 使 用 0~1024 之 间 的 端口 。 这 些 端口 是 作为 熟知 
C well-known ) 端 口 并 保留 给 系统 使 用 的 。 例 如 HTTP 默 认 使 用 端口 80， 
SMTP 默 认 使 用 端口 253 ，rsync 默 认 使 用 端口 873。 绑 定 到 这 些 端 口 通 
常 需要 root 权 限 。 











规则 2: 不 要 使 用 49 000-65 535 之 间 的 端口 。 这 些 都 是 临时 
( ephemeral ) 端口 。 通 常 是 由 那些 不 需要 运行 在 预定 义 端口 ， 而 只 是 
需要 一 些 端口 作为 临时 之 需 的 服务 使 用 。 它们 也 是 后 面 所 要 讲 到 的 连 
接 协 商 ( connection negotiation ) 过 程 的 一 部 分 。 选 择 该 范围 内 的 端口 
可 能 会 对 一 些 用 户 造成 麻烦 。 





除 此 之 外 ，1025~48 999 之 间 端 口 的 使 用 是 一 视 同仁 的 。 如 果 你 打算 
选用 其 中 的 一 个 作为 服务 器 端口 ， 那 你 应 该 看 一 下 IANA 的 注册 端口 
列表 "， 确 保 你 的 选择 不 会 和 其 他 流行 的 服务 器 冲突 。 








3.1.2 ”该 绑 定 到 哪个 地 址 


在 上 面 的 例子 中 ,我 都 是 选择 绑 定 到 0.0.0.0, 如 果 绑 定 到 127.0.0.1 
或 1.2.3.4， 又 会 有 什么 不 同 呢 ? 答案 和 你 所 使 用 的 接口 有 关 。 


之 前 我 提 到 过 系统 中 有 一 个 IP 地 址 为 127.0.0.1 的 环 回 接口 。 同 时 还 
会 有 另 一 个 物理 的 、 基 于 硬件 的 接口 ， 使 用 不 同 的 下 地 址 (假设 是 
192.168.0.5 )。 当 你 绑 定 到 某 个 由 卫 地 址 所 描述 的 特定 接口 时 ， 套 
接 字 就 只 会 在 该 接口 上 进行 侦 听 ， 而 忽略 其 他 接口 。 














(D https://www.iana.org/assignments/service-names-port-numbers/service-names-port-numbers.txt. 
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如 果 绑 定 到 127.0.0.1, 那么 你 的 套 接 字 就 只 会 侦 听 环 回 接口 。 在 这 
种 情况 下 ， 只 有 到 LocaqaLhost 或 127.0.0.1 的 连接 才 会 被 服务 器 套 接 
字 接 受 。 环 回 接口 仅 限 于 本 地 连接 使 用 ， 无 法 用 于 外 部 连接 。 








如 果 绑 定 到 192.168.0.5, 那么 套 接 字 只 侦 听 此 接口 。 任 何 寻 址 到 这 
个 接口 的 客户 端 都 在 侦 听 范围 中 , 但 是 其 他 建立 在 Localhost 上 的 连 
接 不 会 被 该 服务 锅 套 接 字 接受 。 











如 果 你 希望 侦 听 每 一 个 接口 ,那么 可 以 使 用 0.0.0.0。 这 样 会 绑 定 到 
所 有 可 用 的 接口 、 环 回 接口 等 。 大 多 数 时候 ， 这 正 是 你 所 需要 的 。 


4 ./code/snippets/loopback. binding.rb 
require 'socket' 


E 该 套 接 字 将 会 绑 定 在 环 回 接口 ， 只 侦 听 来 自 本 地 主机 的 客户 端 。 

local socket = Socket.new(:INET, :STREAM) 

local. addr- Socket.pack. sockaddr. in(4481, '127.0.0.1') 
local. socket.bind(local. addr) 


E 该 套 接 字 将 会 绑 定 在 所 有 已 知 的 接口 ， 侦 听 所 有 向 其 发 送信 息 的 客户 端 。 
any_socket= Socket.new(:INET, :STREAM) 

any addr = Socket.pack sockaddr. in(4481, '0.0.0.0') 
any. socket .bind(any. addr) 


# 该 套 接 字 试 图 绑 定 到 一 个 未 知 的 接口 ， 结 果 叶 致 Errno: :EADDRNOTAVAIL , 
error. socket = Socket.new(:INET, :STREAM) 

error. addr- Socket.pack. sockaddr. in(4481, '1.2.3.4') 
error. socket.bind(error. addr) 


3.2 ”服务 器 侦 听 




















创建 套 接 字 并 绑 定 到 特定 端口 之 后 , 需要 告诉 套 接 字 对 接 入 的 连接 进 
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行 侦 听 。 


X ./code/snippets/listen.rb 
require 'socket' 


E 创建 套 接 字 并 绑 定 到 端口 4481。 

Socket = Socket.new(:INET, :STREAM) 

addr = Socket.pack sockaddr. in(4481, '0.0.0.0') 
socket .bind(Caddr) 


E 告诉 套 接 字 侦 听 接 入 的 连接 。 
socket.listen(5) 





和 前 一 章 代 码 唯一 的 不 同 之 处 就 是 在 套 接 字 上 多 了 一 个 Listen 调 用 。 








如 果 你 运行 这 个 代码 片段 , 它 仍旧 会 立刻 退出 。 在 服务 器 套 接 字 能 够 
处 理 连接 之 前 ,还 需要 男 一 个 步骤 。 在 下 一 章 中 我 们 会 讲述 。 这 里 先 
解释 下 Listen。 





3.2.1 侦 听 队列 

你 可 能 注意 到 我 们 给 Listen 方 法 传递 了 一 个 整数 类 型 的 参数 。 这 个 
数字 表示 服务 咒 套 接 字 能 够 容纳 的 竺 处理 (pending) 的 最 大 连接 数 。 
竺 处 理 的 连接 列表 被 称 作 侦 听 队列 。 








假设 服务 器 正 忙 于 处 理 某 个 客户 端 连 接 , 如 果 这 时 其 他 新 的 客户 端 连 
接 到 达 , 将 会 被 置 于 侦 听 队列 。 如 果 新 的 客户 端 连接 到 达 且 侦 听 队列 
已 满 ， 那 么 客户 端 将 会 产生 Errno: :ECONNREFUSED。 








3.2.2 ” 侦 听 队列 的 长 度 
侦 听 队列 的 长 度 听 起 来 似乎 是 一 个 神奇 的 数字 。 为 什么 不 把 它 设 成 10 
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000 呢 ? 为 什么 还 要 想 着 拒绝 某 个 连接 呢 ? 这 些 问 题 提 得 很 好 。 


我 们 首先 来 讨论 一 下 侦 听 队列 长 度 的 限制 。 通 过 在 运行 时 查看 
Socket : :SOMAXCONN 可 以 获知 当前 所 允许 的 最 大 的 侦 听 队列 长 度 。 

在 我 的 Mac 上 这 个 数字 是 128。 我 没 法 使 用 更 大 的 数字 。root 用 户 可 以 
在 有 需要 的 服务 器 上 增加 这 个 系统 级 别 的 限 种 








c 
o 





假如 你 运行 的 服务 器 收 到 了 错误 信息 Error: :ECONNREFUSED， 那 增 
加 侦 听 队列 长 度 是 一 个 不 错 的 出 发 点 。 这 也 意味 着 你 所 服务 的 用 户 不 
得 不 等 待 服务 器 的 响应 。 这 也 是 提示 你 需要 更 多 的 服务 器 实例 或 是 需 
要 采用 其 他 架构 。 





一 般 来 说 你 肯定 不 希望 拒绝 连接 ， 可 以 使 用 server.Listen 
CSocket : :SOMAXCONN) 将 侦 听 队列 长 度 设置 为 允许 的 最 大 值 。 


3.9 接受 连接 


我 们 终于 来 到 了 服务 器 实际 处 理 接 入 连接 的 环节 。 这 是 通过 accept 
方法 实现 的 ,下 面 的 代码 演示 了 如 何 创建 侦 听 套 接 字 ,接受 首 个 连接 : 














# ./code/snippets/accept.rb 
require 'socket' 


E 创建 服务 器 套 接 字 。 

server = Socket.new(:INET, :STREAM) 

addr = Socket.pack sockaddr. in(4481, '0.0.0.0') 
server.bind(addr) 

server.listen(128) 


H 接受 连接 。 
connection, . = server.accept 
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如 果 现 在 运行 这 段 代码 , 你 会 发 现 这 次 它 没有 立刻 退出 ! 没 错 , accept 
方法 会 一 直 阻 塞 到 有 连接 到 达 。 让 我 们 用 netcat 发 起 一 个 连接 : 








$ echo ohai | nc localhost 4481 








运行 结果 是 nc(1) 且 Ruby 程 序 都 顺利 退出 。 最 精彩 的 并 不 在 于 此 ， 而 
在 于 连接 已 经 建立 ， 一 切 工作 正常 。 庆 祝 下 吧 ! 
3.3.1 以 阻塞 方式 接受 连接 


accept 调 用 是 阻塞 式 的 。 在 它 接收 到 一 个 新 的 连接 之 前 ， 它 会 一 直 

















还 记得 上 一 章 讨 论 过 的 侦 听 队列 吗 ? qccept 只 不 过 就 是 将 还 未 
处 理 的 连接 从 队列 中 弹出 (pop) 而 已 。 如果 队列 为 空 ， 那么 它 就 
一 直 等 ， 直 到 有 连接 被 加 入 队列 为 止 。 


3.3.2 accept 调 用 返回 一 个 数组 


在 上 面 的 例子 中 ， 我 从 accept 调 用 中 获得 了 两 个 返回 值 。aqccept 方 
法 实际 上 返回 的 是 一 个 数组 。 这 个 数组 包含 两 个 元 素 : 第 一 个 元 素 是 
建立 好 的 连接 ， 第 二 个 元 素 是 一 个 Addrinfo 对 象 。 该 对 象 描述 了 客 
户 端 连接 的 远程 地 址 。 











Addrinfo 
Addrinfo 是 一 个 Ruby 类 ,描述 了 一 台 主 机 及 其 端口 号 。 它 将 端点 
信息 进行 了 包装 。 你 会 在 书 中 的 其 他 地 方 看 到 它 作 为 Socket 接 口 
的 一 部 分 出 现 。 
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可 以 使 用 Addrinfo.tcpC'localhost'，4481) 构 建 这 些 人 
一 些 有 用 的 方法 包括 大 p_address e fip port. € 
Addrinfo 了 解 更 多 信息 。 


接 下 来 仔细 查看 一 下 #accept 返 回 的 连接 和 地 址 。 


€ ./code/snippets/accept. connection. class.rb 
require 'socket' 


E 创建 服务 器 套 接 字 。 

server = Socket.new(:INET, :STREAM) 

addr = Socket.pack sockaddr. in(4481, '0.0.0.0') 
server.bind(Caddr) 

server.listen(128) 


# 接受 一 个 新 连接 。 
connection, . = server.accept 


print 'Connection class: ' 
p connection.class 


print 'Server fileno: ' 
p server.fileno 


print 'Connection fileno: ' 
p connection.fileno 


print 'Local address: ' 
p connection.local. address 


print 'Remote address: ' 
p connection.remote address 


当 服 务 顺 获得 一 个 连接 ( 使 用 之 前 用 过 的 netcat 命 令 )， 它 会 输出 : 
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Connection class: Socket 

Server fileno: 5 

Connection fileno: 8 

Local address: #<Addrinfo: 127.0.0.1:4481 TCP> 
Remote address: #<Addrinfo: 127.0.0.1:58164 TCP> 





代码 输出 告诉 了 我 们 一 系列 TCP 连 接 相关 的 处 理 信 息 。 下 面 逐 一 进行 
分 析 。 


3.8.8 ”连接 类 

尽管 accept 返 回 了 一 个 “连接 ”, 但 是 这 段 代码 告诉 我 们 并 没有 特殊 的 

连接 类 ( connection class )。 一 个 连接 实际 上 就 是 Socket 的 一 个 实例 。 

3.3.4 ”文件 描述 符 

我 们 知道 qccept 返 回 一 个 Socket 的 实例 ， 不 过 这 个 连接 的 文件 描述 
号 是 内 核 


符 编号 和 服务 带 套 接 字 不 一 样 。 文件 描述 符 编号 是 内 核 用 于 跟踪 当前 
进程 所 打开 文件 的 一 种 方法 。 








套 接 字 是 文件 吗 ? 
套 接 字 是 文件 。 至 少 在 Unix 世 界 中 ， 所 有 的 一 切 都 被 视 为 文件 。" 
这 包括 文件 系统 中 的 文件 以 及 管道 、 套 接 字 和 打印 机 ， 等 等 。 


这 表明 accept 返 回 了 一 个 不 同 于 服务 器 套 接 字 的 全 新 Socket。 这 个 
Socket 实 例 描 述 了 特定 的 连接 。 这 一 点 很 重要 。 每 个 连接 都 由 一 个 
全 新 的 Socket 对 象 描述 ， 这 样 服务 器 套 接 字 就 可 以 保持 不 变 ， 不 停 
地 接受 新 的 连接 。 




















(D http://ph7spot.com/musings/in-unix-everything-is-a-file. 
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3.3.5 ”连接 地 址 


连接 对 象 知道 两 个 地 址 : 本 地 地 址 和 远程 地 址 。 其 中 的 远程 地 址 是 
accept 的 第 二 个 返回 值 , 不 过 也 可 以 从 连接 中 的 remote_address 访 
问 到 。 





连接 的 Local_address 指 的 是 本 地 主机 的 端点 ，remote_address 指 
的 是 另 一 端的 端点 ， 而 这 个 端点 可 能 位 于 另 一 台 主 机 , 也 可 能 存在 于 
司 一 台 主 机 ( 本 例 便 是 如 此 )。 


每 一 个 TCP 连 接 都 是 由 “本 地 主机 、 本 地 端口 、 远 程 主机 、 远 程 端口 ” 
这 组 唯一 的 组 合 所 定义 的 。 对 于 所 有 TCP 连 接 而 言 ， 这 4 个 属性 的 组 
合 必须 是 唯一 的 。 





让 我 们 来 考虑 一 下 。 你 可 以 同时 从 本 地 主机 上 向 远程 主机 发 起 两 个 连 
接 ， 只 要 远程 端口 不 重复 即 可 。 类 似 地 ， 如 果 远 程 端口 不 重复 , 你 也 
可 以 在 同一 个 本 地 端口 上 同时 接受 来 自 远程 主机 的 两 个 连接 。 但 是 如 

果 两 组 本 地 端口 和 远程 端口 都 是 一 样 的 , 那 就 无 法 同时 建立 到 同一 台 
远程 主机 的 两 个 连接 了 。 























3.8.6 ”accept 循 环 


accept 会 返回 一 个 连接 。 在 前 面 的 代码 中 ， 服 务 器 接受 了 一 个 连接 
后 退出 。 在 编写 真正 的 服务 器 代码 时 ， 只 要 还 有 接 和 人 的 连接 ,我 们 肯 
定 希 望 不 停 地 侦 听 。 这 可 以 很 轻松 地 通过 循环 来 实现 : 


# ./code/snippets/naive. accept. loop.rb 
require 'socket' 


E 创建 服务 器 套 接 字 。 
server = Socket.new(:INET, :STREAM) 
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addr = Socket.pack sockaddr. in(4481, '0.0.0.0') 
server.bind(Caddr) 
server.listen(128) 


E 进入 无 限 循 环 ， 接 受 并 处 理 连接 。 

loop do 
connection, _ = server.accept 
# 处 理 连 接 。 
connection.close 

end 


ifs H Ruby ii 53 KIRI di B5) — Rp à ULT; FT UM AREK 
中 应 用 广泛 , Ruby 在 其 基础 上 提供 了 一 些 语 法 糖 。 在 本 章 结 尾 处 我 们 
会 看 到 一 些 经 由 Ruby 包 装 过 的 方法 。 





3.4 关闭 服务 器 


一 旦 服务 器 接受 了 某 个 连接 并 处 理 完 毕 , 那么 最 后 一 件 事 就 是 关闭 该 
连接 。 这 就 算是 完成 了 一 个 连接 的 “创建 -处 理 -关闭 ”的 生命 周期 。 
我 就 不 青 贴 上 男 一 段 代码 了 , 继续 参考 上 面 的 代码 段 。 在 接受 新 的 连 
接 之 前 ， 先 在 之 前 的 连接 上 调用 close 即 可 。 





3.4.1 退出 时 关闭 

为 什么 需要 close? 当 程 序 退出 时 ， 系 统 会 帮 你 关闭 所 有 打开 的 文件 
描述 符 ( 包括 套 接 字 )。 那 为 什么 还 要 自己 动手 去 关闭 呢 ? 这 有 以 下 
两 个 很 好 的 理由 。 











(1) 资源 使 用 。 如 果 你 使 用 了 套 接 字 却 没 有 关闭 它 ， 那 么 那些 你 已 不 
再 使 用 的 套 接 字 的 引用 很 可 能 依然 保留 着 。 在 Ruby 中 ,垃圾 收集 
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顺 可 是 你 的 好 伙伴 ， 帮 你 清理 用 不 着 的 连接 ， 不 过 保持 自己 所 用 





资源 的 完全 控 人 








判 权 ， 丢 掉 不 再 需要 的 东西 总 是 一 个 不 错 的 想法 。 


要 注意 的 是 ， 垃 圾 收集 融会 将 它 收集 到 的 所 有 一 切 全 部 关闭 。 


(2) 打开 文件 的 数量 限制 。 这 实际 上 是 上 一 个 理由 的 延伸 。 所 有 进程 
一 定数 量 的 文件 。 还 记 不 记得 前 面 说 过 每 个 连接 都 


都 只 能 够 打开 











是 一 个 文件 ? 保留 无 用 的 连接 会 使 进程 逐步 通 近 这 个 上 限 ， 退 早 


会 出 问题 。 


要 获知 当前 进程 


所 允许 打开 文件 的 数量 ， 你 可 以 使 用 Process . 


getrlimit(:NOFILE) 。 返 回 值 是 一 个 数组 ， 包 含 了 软 限 制 〈 用 
户 配 置 的 设置 ) 和 硬 限制 ( 系统 限制 )。 


如 果 想 将 限制 设置 到 最 大 值 ， 可 以 使 用 Process.setrlimit 
CProcess.getrlimit(:NOFILE)[1]) 。 


3.4. 不 同 的 关闭 方式 
考虑 到 套 接 字 允许 双向 通信 ( 读 / 写 )， 实 际 上 可 以 只 关闭 其 中 一 个 











# ./code/snippets/close write.rb 


require 'socket' 


7 创建 服务 器 套 接 


年 


server = Socket.new(:INET, :STREAM) 


addr - Socket. 


pack sockaddr in(4481, '0.0.0.0') 


server.bind(Caddr) 
server.listen(128) 


connection, _ 


= server.accept 
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E 该 连接 随后 也 许 不 再 需要 写 入 数据 ， 但 是 可 能 仍 需 要 进行 读 取 。 
connection.close write 
# 该 连接 不 再 需要 进行 任何 数据 读 写 操作 。 
connection.close. read 
关闭 写 操作 流 ( write stream ) 会 发 送 一 个 EOF 到 套 接 字 的 另 一 端 。( 我 
们 很 快 就 会 讲 到 EOF。 ) 





close_write 和 close_read 方 法 在 底层 都 利用 了 shutdown(2)。 同 
close(C2) 明 显 不 同 的 是 : 即便 是 存在 着 连接 的 副本 ，shutdown(2) 也 可 
以 完全 关闭 该 连接 的 某 一 部 分 。 





连接 副本 是 怎么 回 事 ? 
可 以 使 用 Socket#dup 创 建文 件 描述 符 的 副本 。 这 实际 上 是 在 操作 
ap uM DUE DE LU 
极为 罕见 ， 你 不 大 可 能 会 碰 上 。 


获得 一 个 文件 描述 符 副 本 的 更 常见 的 方法 是 利用 Process .fork 方 
法 。 该 方法 创建 了 一 个 全 新 的 进程 ( 仅 在 Unix 环 境 中 )， 这 个 进程 
和 当前 进程 一 模 一 样 。 除 了 拥有 当前 进程 在 内 存 中 的 所 有 内 容 之 
外 ， 新 进程 还 通过 dup(2) 获 得 了 所 有 已 打开 的 文件 描述 符 的 副本 。 





close 会 关闭 调用 它 的 套 接 字 实 例 。 如 果 该 套 接 字 在 系统 中 还 有 其 他 副 
本 ， 那 么 这 些 副本 不 会 被 关闭 ， 所 占用 的 资源 也 不 会 被 回收 。 没 错 ， 
连接 的 其 他 副本 仍然 可 以 交换 数据 ， 即 便 是 在 某 个 实例 已 经 被 关闭 的 
情况 下 。 


和 close 不 同 ，shutdown 会 完全 关闭 在 当前 套 接 字 及 其 副本 上 的 通 
fis 但 是 它 并 不 会 回收 套 接 字 所 使 用 过 的 资源 。 每 个 套 接 字 实例 仍 必 
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须 使 用 close 结 束 它 的 生命 周期 。 


# ./code/snippets/shutdown.rb 
require 'socket' 


E 创建 服务 器 套 接 字 。 

server = Socket.new(:INET, :STREAM) 

addr = Socket.pack sockaddr. in(4481, '0.0.0.0') 
server.bind(addr) 

server.listen(128) 

connection, _ = server.accept 


E 创建 连接 副本 。 
copy = connection.dup 


X 关闭 所 有 连接 副本 上 的 通信 。 
connection.shutdown 


## 关闭 原始 连接 。 副 本 会 在 垃圾 收集 器 进行 收集 时 关闭 。 
connection.close 


3.5 Ruby 包装 器 


我 们 都 熟知 并 热爱 Ruby 所 提供 的 优雅 语法 , 它 用 来 创建 及 使 用 服务 器 
套 接 字 的 扩展 也 会 让 你 爱不释手 。 这 些 便捷 的 方法 将 样本 代码 
( boilerplate code ) 包装 在 定制 的 类 中 并 尽 可 能 地 利用 Ruby 的 语句 块 。 
下 面 我 们 来 看 一 下 它 是 如 何 实现 的 。 











3.5.4 服务 器 创建 


首先 是 TCPServer 类 。 它 将 进程 中 “服务 器 创建 ”这 部 分 进行 了 非常 
简洁 的 抽象 。 
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# ./code/snippets/server. easy. way.rb 
require 'socket' 
server = TCPServer.new(4481) 


， 现 在 看 起 来 更 有 Ruby 味 儿 了 。 这 段 代 码 实 际 上 是 如 下 代码 的 
替换 : 














4 ./code/snippets/server. hard. way.rb 
require 'socket' 


server = Socket.new(:INET, :STREAM) 

addr = Socket.pack sockaddr. in(4481, '0.0.0.0') 
server.bind(addr) 

server.listen(5) 





我 很 清楚 自己 该 选 哪 一 种 ! 


创建 一 个 TCPServer 实 例 返 回 的 实际 上 并 不 是 Socket 实 例 ， 而 是 
TCPServer 实 例 。 两 者 的 接口 几乎 一 样 ， 但 还 是 存在 一 些 重 要 的 
差异 。 其 中 最 明显 的 就 是 TCPSeprver#accept 只 返回 连接 ， 而 不 
返回 remote_qddress。 

有 没有 注意 到 我 们 并 没有 为 这 些 构造 函数 指定 侦 听 队列 的 长 度 ? 

因为 用 不 着 使 用 Socket : :SOMAXCONN，Ruby 默 认 将 侦 听 队列 长 度 
设置 为 5。 如 果 需 要 更 长 的 侦 听 队列 ,可 以 调用 TCPServer#listen。 


随 着 IPv6 的 发 展 势头 越发 变 得 迅猛 ,你 的 服务 器 也 许 得 能 够 同时 处 理 
IPv4 和 IPv6。 使 用 这 个 Ruby 包 装 器 会 返回 两 个 TCP 套 接 字 ， 一 个 可 以 
通过 IPv4 连 接 ， 另 一 个 可 以 通过 IPv6 连 接 ， 两 者 都 在 同一 个 端口 上 进 

行 侦 听 。 
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# ./code/snippets/server_sockets.rb 
require 'socket' 


servers = Socket.tcp. server. sockets(4481) 


3.5.2 ”连接 处 理 
除了 创建 服务 器 ，Ruby 也 为 连接 处 理 提 供 了 优美 的 抽象 。 


还 记得 使 用 Loop 处 理 多 个 连接 吗 ” 聪明 人 才 不 会 用 Loop 呢 。 应 该 像 
下 面 这样 做 : 


€ ./code/snippets/accept. loop.rb 
require 'socket' 


TH] VETERE S 
server = TCPServer.new(4481) 


Ho 进入 无 限 循环 接受 并 处 理 连 接 。 

Socket.accept loop(server) do 1connectionl 
# 处 理 连 接 。 
connection.close 

end 





要 注意 连接 并 不 会 在 每 个 代码 块 结尾 处 自动 关闭 ,传递 给 代码 块 的 参 
数 和 accept 调 用 的 返回 值 一 模 一 样 。 


Socket .qccept_Loop 还 有 另外 一 个 好 处 : 你 可 以 向 它 传递 多 个 侦 听 
套 接 字 ,， 它 可 以 接受 在 这 些 套 接 字 上 的 全 部 连接 。 这 和 Socket .tcp_ 


182832. 


server_sockets 可 谓 是 相得益彰 











# ./code/snippets/accept_server_sockets.rb 
require 'socket' 
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E 创建 侦 听 套 接 字 。 
servers = Socket.tcp. server. sockets(4481) 


E 进入 无 限 循 环 ， 接 受 并 处 理 连接 。 

Socket.accept loop(servers) do 1connectionl 
# 处 理 连接 。 
connection.close 

end 





我 们 传递 了 多 个 套 接 字 给 Socket .aqccept_Loop, 由 它 来 进行 妥善 处 理 。 


3.5.8 合 而 为 一 


这 些 Ruby 包 装 需 的 集大成 者 是 Socket . tcp. server. loop, 它 将 之 前 
的 所 有 步骤 合 而 为 一 : 





€ ./code/snippets/tcp. server. loop.rb 
require 'socket' 


Socket.tcp. server. 1oop(4481) do lconnectionl 
# 处 理 连 接 。 
connection.close 

end 


该 方法 实际 上 只 是 Socket . tcp. server. sockets filSocket accept. loop 
的 一 个 包装 器 而 已 ， 但 再 也 没有 比 它 更 简洁 的 写法 了 。 





3.6 本章 涉 及 的 系统 调用 


口 Socket#bind 一 bind(2) 
口 Socket£listen > listen(2) 





OQ Socket£Zaccept 一 accept(2) 
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口 Socket£local. address 一 getsockname(2) 
Q Socket£remote address — getpeername(2) 
Q Socket£close — close(2) 

ū Socket£Zclose. write — shutdown(2) 

DQ Socket£shutdown — shutdown(2) 
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客户 端 生命 周期 











我 之 前 提 到 过 一 个 网 络 连接 有 两 个 重要 的 组 成 部 分 。 服 务 咒 负责 侦 听 
及 处 理 接 和 人 的 连接 。 客 户 端 负责 向 服务 器 发 起 连接 ,也 就 是 说 , 它 知 
道 特定 服务 器 的 位 置 并 创建 指向 外 部 服务 顺 的 连接 。 








很 显然 ， 没 有 客户 端的 服务 器 是 不 完整 的 。 

客户 端的 生命 周期 要 比 服 务 器 短 一 些 。 它 包括 以 下 几 个 阶段 : 
(1) 创建 ; 

(2) 绑 定 ; 

(3) 连接 ; 

(4) 关闭 。 


第 一 个 阶段 对 于 客户 端 和 服务 器 来 说 都 是 一 样 的 ， 所 以 就 客户 端 而 
言 ， 我 们 从 第 二 个 阶段 “ 绑 定 ”开始 讲 起 。 
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4.1 客户 端 绑 定 








客户 端 套 接 字 和 服务 器 套 接 字 一 样 ， 都 是 以 bind 作为 起 始 。 在 服务 
器 部 分 ， 我 们 使 用 特定 的 地 址 和 端口 来 调用 bind。 很 少 会 有 服务 器 
不 去 调用 bind， 也 很 少 会 有 客户 端 去 调用 bind。 如 果 客 户 端 套 接 字 
(或 者 服务 器 套 接 字 ) 不 调用 bind, 那么 它 会 从 临时 端口 范围 内 获得 
一 个 随机 端口 号 。 











为 什么 不 调用 bind? 
客户 端 之 所 以 不 需要 调用 bind， 是 因为 它们 无 需 通 过 某 个 已 知 端 
口 访问 。 而 服务 器 要 绑 定 到 特定 端口 的 原因 是 ， 窜 户 端 需要 通过 
特定 的 端口 访问 到 服务 器 。 
以 FTP 为 例 。 它 的 熟知 端口 是 21。 因 此 FTP 服 务 器 应 该 绑 定 到 该 端 
口 ， 这 样 客户 端 就 知道 从 哪里 获取 FTP 服 务 了 。 客 户 端 可 以 从 任 
何 端口 发 起 连接 ， 客 户 端 选择 的 端口 号 不 会 影响 到 服务 器 。 


客户 端 不 需要 调用 bind， 因 为 没有 人 需要 知道 它们 的 端口 号 。 


这 一 节 并 没有 展示 什么 代码 ， 因 为 我 的 建议 是 : 不 要 给 客户 端 绑 定 
端口 ! 


4.2 客户 端 连 接 


客户 端 和 服务 顺 真 正 的 区 别 就 在 于 connect 调用 。 该 调用 发 起 到 远 
程 套 接 字 的 连接 。 
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€ ./code/snippets/connect.rb 
require 'socket' 
Socket = Socket.new(:INET, :STREAM) 
# 发 起 到 google.com 端口 80 的 连接 。 


remote addr = Socket.pack sockaddr. in(80, 'google.com') 
socket.connect(remote addr) 


因为 我 们 在 这 里 使 用 的 是 低层 次 函数 , 所 以 需要 将 地 址 对 象 转换 成 C 
语言 结构 体 的 描述 形式 。 


该 代码 片段 从 本 地 的 临时 端口 向 在 google.com 的 端口 80 上 进行 侦 听 
的 套 接 字 发 起 TCP 连接 。 注 意 我 们 并 没有 调用 bind. 





连接 故障 


在 客户 端的 生命 周期 中 , 很 可 能 在 服务 器 还 没准 备 好 接受 连接 之 前 客 
户 端 就 发 起 了 连接 。 同 样 也 有 可 能 连接 了 一 个 并 不 存在 的 服务 器 。 两 
种 情况 实际 上 是 殊途同归 。 因 为 TCP 所 具备 的 容错 性 ， 它 会 尽 最 大 
可 能 等 竺 远程 主机 的 回应 。 


Ju 
下 面试 试 连接 一 个 不 可 用 的 端点 : 








X ./code/snippets/connect. non. existent.rb 
require 'socket' 


Socket = Socket.new(:INET, :STREAM) 


# 尝试 在 gopher port? Ei£i& google.com, 
remote addr = Socket.pack_sockaddr_in(70, 'google.com') 








(D http://en.wikipedia.org/wiki/Gopher_(protocol) 一 一 译 者 注 
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socket.connect(remote addr) 


如 果 你 运行 这 段 代码 ， 它 花费 很 长 时 间 才 能 从 connect 调用 返回 。 
conncet 调用 默认 有 一 段 较 长 时 间 的 超时 。 





这 对 于 那些 带宽 有 限 、 需 要 花费 长 时 间 建 立 连接 的 客户 端 来 说 是 有 意 
义 的 。 至 于 那些 没有 带宽 烦恼 的 客户 端 , 这 种 默认 的 超时 行为 也 无 碍 
于 同 远 端 快速 建立 连接 。 











但 如 果 出 现 超时 ， 最 终 会 产生 一 个 Errno: :ETIMEOUT 异常 。 这 属于 
一 般 性 的 超时 异常 ， 如 果 同 套 接 字 打 交道 , 就 表明 所 请 求 的 操作 超时 
了 。 如 果 你 对 调 校 套 接 字 超 时 感 兴趣 ， 请 参看 第 15 章 。 

















当 客 户 端 连接 到 一 个 已 经 调用 过 bind 和 1listen ,但 尚未 调用 accept 
的 服务 器 时 ， 也 会 出 现 同 样 的 情况 。 只 有 远程 服务 器 接受 了 连接 ， 
connect 调用 才 会 成 功 返 回 。 





4.3 Ruby tig 








创建 客户 端 套 接 字 的 代码 几乎 和 创建 服务 器 套 接 字 一 样 繁琐 、 低 级 。 
如 我 们 所 愿 ，Ruby 也 对 其 进行 了 包装 ， 使 它们 更 易于 使 用 。 








客户 端 创建 
在 向 你 展现 优美 的 Ruby 风格 的 代码 之 前 ， 我 要 先 让 你 看 看 那些 低级 
繁琐 的 代码 ， 这 样 才能 够 有 所 比较 : 
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€ ./code/snippets/connect.rb 
require 'socket' 
Socket = Socket.new(:INET, :STREAM) 
# 发 起 到 google.com 端口 80 的 连接 。 


remote addr = Socket.pack sockaddr. in(80, 'google.com') 
socket.connect(remote addr) 


用 了 语法 糖 之 后 : 
# ./code/snippets/client. easy. way.rb 

require 'socket' 

Socket = TCPSocket.new('google.com', 80) 
这 下 子 感觉 好 多 了 。 之 前 的 三 行 代码 、 两 个 构造 函数 以 及 大 量 的 上 下 
文 被 精简 为 一 个 构造 函数 。 
还 有 一 个 使 用 Socket. tcp 的 类 似 的 客户 端 构建 方法 , 它 可 以 采用 代 
码 块 的 形式 : 


€ ./code/snippets/client block form.rb 
require 'socket' 


Socket.tcp('google.com', 80) do lconnectionl 
connection.write"GET / HTTP/1.1NrNn" 
connection.close 

end 


E 如 果 省 略 代码 块 参 数 ， 则 行为 方式 同 TCPSocket .new() 一 样 。 
client = Socket.tcp('google.com', 80) 
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4.4 本 章 涉及 的 系统 调用 


口 Socket#bind 一 bind(2) 





口 Socket£connect 一 connect(2) 
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第 5 章 


交换 数据 





前 面 的 部 分 都 是 关于 建立 连接 ,连接 两 个 端点 的 内 容 。 尽管 这 本 身 也 
HATE, 但 是 如 果 连 接 上 没有 数据 的 交换 ,你 实际 上 什么 有 意义 的 
事 也 做 不 了 。 本 章 就 来 解决 这 个 问题 。 最 终 我 们 不 仅 可 以 建立 服务 顺 
和 客户 端的 连接 ， 还 能 够 让 它们 进行 数据 交换 。 








在 深入 学 习 之 前 ， 我 想 强调 ， 你 可 以 将 TCP 连接 想象 成 一 串 连接 了 
本 地 套 接 字 和 远程 套 接 字 的 管子 , 我 们 可 以 沿 着 这 根 管子 发 送 、 接 收 
数据 。 这 种 想象 有 助 于 增进 我 们 对 TCP 的 理解 。Berkeley 套 接 字 API 
就 是 这 样子 设计 的 , 我 们 同样 以 这 种 方式 对 身边 的 世界 进行 建 模 , 解 
决 各 类 问题 。 

















在 实际 中 ， 所 有 的 数据 都 被 编码 为 TCP/IP 分 组 ， 在 抵达 终点 的 路 上 
可 能 会 途经 多 台 路 由 器 和 主机 。 这 个 世界 有 点 疯狂 ,所 以 最 好 记 住 并 
非 事 事 都 会 一 帆 风 顺 , 不 过 我 们 也 要 感谢 在 这 个 疯狂 的 世界 中 辛勤 工 
ERAN, 他 们 为 我 们 掩盖 了 那些 不 如 意 之 处 ,使 我 们 保留 了 对 于 世 
界 的 简单 想象 。 
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还 有 一 件 事 我 需要 说 清楚 ， 即 T 
我 们 还 没有 讲 过 。 


CP 所 具有 的 基于 流 的 性 质 ， 这 一 点 








回 到 本 书 伊 始 ， 当 时 我 们 创建 了 第 一 个 套 接 字 并 传人 了 一 个 叫 
做 :STREAM 的 选项 ， 该 选项 表明 我 们 希望 使 用 一 个 流 套 接 字 。TCP 
是 一 个 基于 流 的 协议 。 如 果 我 们 在 创建 套 接 字 时 没有 传人 :STREAM 选 


项 ， 那 就 无 法 创建 TCP 套 接 字 。 














那么 这 究竟 意味 着 什么 ?” 这 对 于 我 们 的 代码 会 产生 什么 影响 呢 ? 


首先 ， 前 面 提 到 的 术语 “分 组 ”了 





其 实 已 经 给 出 了 暗示 。 从 协议 层面 上 


而 言 ，TCP 在 网 络 上 发 送 的 是 分 组 。 


不 过 我 们 不 打算 讨论 分 组 。 从 应 用 程序 代码 的 角度 上 来 说 , TCP 连接 
提供 了 一 个 不 间断 的 、 有 序 的 通信 流 。 只 有 流 ， 别 无 其 他 。 


让 我 们 用 一 些 伪 代码 进行 演示 。 








E 下 面 的 代码 会 在 网 络 上 发 送 3 份 数据 ， 一 次 一 份 。 


datos Bd cM E | 
for piece in data 
write. to. connection(piece 


end 


Ë 下 面 的 代码 在 一 次 操作 中 读 取 全 部 
result = read. from connecti 
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这 段 代 码 想 传达 的 是 : 流 并 没有 消息 边界 的 概念 。 即 便 是 客户 端 分 别 
发 送 了 3 份 数 据 ， 服 务 器 在 读 取 时 ， 也 是 将 其 作为 一 份 数据 来 接收 。 
它 并 不 知道 客户 端 是 分 批发 送 的 数据 。 








要 注意 的 是 , 尽管 并 不 保留 消息 边界 , 但 是 流 中 内 容 的 次 序 还 是 会 保 


留 的 。 
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矢 接 字 读 操作 





至 此 我 们 已 经 讨论 了 不 少 关 于 连接 的 话题 。 现 在 我 们 要 进入 真正 有 趣 
的 部 分 : 如 何在 套 接 字 连接 上 传送 数据 。 在 使 用 套 接 字 时 ， 有 多 种 方 
法 可 以 进行 数据 读 写 , 这 没什么 好 惊讶 的 。 除 此 之 外 , Ruby 还 为 我 们 
提供 了 一 些 优雅 便捷 的 包装 器 。 














本 划 将 深入 学 习 各 种 读 取 数据 的 方法 以 及 各 自 的 适用 场景 。 


6.1 简单 的 读 操作 








从 套 接 字 读 取 数 据 最 简单 的 方法 是 使 用 read: 


€ ./code/snippets/read.rb 
require 'socket' 


Socket.tcp. server. 1oop(4481) do lconnectionl 
E 从 连接 中 读 取 数据 最 简单 的 方法 。 
puts connection.read 


E 完成 读 取 之 后 关闭 连接 。 让 客户 端 知 道 不 用 再 等 待 数 据 返 回 。 


connection.close 
end 
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如 果 你 在 终端 上 运行 这 个 例子 ， 在 男 一 个 终端 上 运行 下 面 的 netcat 
命令 ， 将 会 在 Ruby 服 务 器 中 看 到 输出 结 


$ echo gekko | nc localhost 4481 


如 果 你 使 用 过 Ruby 的 File API， 那 么 这 段 代 码 可 能 看 起 来 手眼 
熟 。Ruby 的 各 种 套 接 字 类 以 及 File 在 I0 中 都 有 一 个 共同 的 父 类 。 
Ruby 中 所 有 的 IO 对 象 ( 套 接 字 、 管 道 、 文 件 …… ) 都 有 一 套 通用 
的 接口 ， 支 持 reaqd、write、flush 等 方法 。 

这 的 确 不 是 Ruby 的 创新 。 底 层 的 read(2)，write(2) 等 系统 调用 都 可 
以 作用 于 文件 、 套 接 字 、 管 道 等 之 上 。 这 种 抽象 源 自 于 操作 系统 
核心 本 身 。 记 住 ， 一 切 缘 为 文件 。 


6.2 没 那么 简单 


读 取 数 据 的 方法 很 简单 ， 但 是 容易 出 错 。 如 果 你 运行 下 面 的 netcat 
命令 , 然后 撒手 不 管 ,服务 器 将 永远 不 会 停止 读 取 数 据 ， 也 永远 不 会 
退出 : 


$ tail -f /var/log/system.log | nc localhost 4481 


造成 这 种 情况 的 原因 是 EOF ( end-of file )。 下 一 节 我 们 会 详细 讨论 。 
此 刻 我 们 暂且 不 理会 EOF， 来 看 一 种 不 太 成 熟 的 解决 方法 。 


这 个 问题 的 关键 在 于 tail -f 根 本 就 不 会 停止 发 送 数 据 。 如 果 tail 没 
有 数据 可 以 发 送 ， 它 会 一 直 等 到 有 为 止 。 这 使 得 连接 netcat 的 管 
道 一 直 处 于 打开 状态 ,因此 netcat 也 永远 都 不 会 停止 向 服务 器 发 送 
数据 。 
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服务 器 的 read 调 用 就 一 直 被 阻塞 着 , 直到 客户 端 发 送 完 数据 为 止 。 在 
我 们 的 这 个 例子 中 ， 服 务 器 就 这 样 等 待 …… 等 待 …… 一 直 等 竺 ……， 
在 这 期 间 它 会 将 接收 到 的 数据 缓冲 起 来 ， 不 返回 给 应 用 程序 。 











6.3 读 取 长 度 





解决 以 上 问题 的 一 个 方法 是 指定 最 小 的 读 取 长 度 。 这 样 就 不 用 等 到 客 
户 端 结束 发 送 才 停止 读 取 操作 , 而 是 告诉 服务 器 读 取 ( read ) 特定 的 
数据 量 ， 然 后 返回 。 

# ./code/snippets/read. with. Length.rb 


require 'socket' 
one kb = 1024 2 字 节 数 


Socket.tcp. server. 1o0op(4481) do lconnectionl 
# 以 为 1KB 为 单位 进行 读 取 。 
while data = connection.read(one kb) do 
puts data 
end 


connection.close 
end 


和 上 一 市 一 样 运行 以 下 命令 : 
$ tail -f /var/log/system.log | nc localhost 4481 


上 面 的 代码 会 使 服务 咒 在 netcat 命 令 运 行 的 同时 , 以 IKB 为 单位 打印 


这 个 例子 的 不 同 之 处 在 于 我 们 给 read 传 递 了 一 个 整数 。 它 告诉 read 
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在 读 取 了 一 定数 量 的 数据 后 就 停止 读 取 并 返回 。 由 于 希望 得 到 所 有 可 
用 的 数据 , 我 们 在 调用 read 方 法 时 使 用 了 循环 , 直到 它 不 再 返回 数据 
为 止 。 





6.4 阻塞 的 本 质 








read 调 用 会 一 直 阻 蹇 ， 直 到 获取 了 完整 长 度 (full length) 的 数据 为 
止 。 在 上 面 的 例子 中 每 次 读 取 1KB 。 运 行 几 次 之 后 ， 应 该 会 清楚 地 发 
现 : 如 果 读 取 了 一 部 分 数据 ， 但 是 不 足 IKB ， 那 么 reqad 会 一 直 阻 塞 ， 
直至 获得 完整 的 IKB 数 据 为 止 。 























采用 这 种 方法 实际 上 有 可 能 会 导致 死 锁 。 如 果 服 务 器 试图 从 连接 中 读 
取 1KB 的 数据 ,而 客户 端 只 发 送 了 500B 后 就 不 再 发 送 了 , 那么 服务 器 
就 会 一 直 傻 等 着 那 没 发 的 500B! 





有 两 种 方法 可 以 补救 : (1) 客户 端 发 送 完 500B 后 再 发 送 一 个 EOF; (2) Jl 
务 器 采用 部 分 读 取 (partial read ) 的 方式 。 


65 EOF 事件 





当 在 连接 上 调用 read 并 接收 到 EOF 事 件 时 ， 就 可 以 确定 不 会 再 有 数 
据 ， 可 以 停止 读 取 了 。 这 个 概念 对 于 理解 IO 操作 至 关 重 要 。 


先 插 点 历史 典故 : EOF 代 表 “end offile”( 文 件 结束 )。 你 大 概 会 说 : 
“我 们 现在 处 理 的 又 不 是 文件 ……。?” 说 的 基本 没 错 ,不 过 请 记 住 “一 
切 丝 是 文件 ”。 
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有 了 时候 你 可 能 会 看 到 “EOF 字 符 ” 的 说 法 ,不 过 其 实 并 没有 这 样 的 东 
西 .了 EOF 并 不 代表 某 种 字符 序列 , 它 更 像 是 一 个 状态 事件 ( state event )。 
如 果 一 个 套 接 字 没有 数据 可 写 , 它 可 以 使 用 shutdown 或 close 来 表明 
自己 不 再 需要 写 入 任何 数据 。 这 就 会 导致 一 个 EOF 事 件 被 发 送 给 在 男 
一 端 进行 读 操作 的 进程 ， 这 样 它 就 知道 不 会 再 有 数据 到 达 了 











让 我 们 从 头 再 来 审视 并 解决 上 一 节 的 那个 问题 : 如 果 服 务 器 希望 接受 
1KB 数 据 ， 而 客户 端 却 只 发 送 了 500B。 
一 种 改进 方法 是 客户 端 发 送 $00B, 然后 再 发 送 一 个 EOF 事 件 。 服 务 需 
接收 到 该 事件 后 就 停止 读 取 ， 即 便 是 还 未 接收 够 1KB。EOF 表 明 不 会 
再 有 数据 到 达 了 
下 面 是 正确 的 数据 读 取代 码 : 
# ./code/snippets/read_with_length.rb 
require 'socket' 
one kb = 1024 4 字 节 数 
Socket.tcp. server. 1oop(4481) do lconnectionl 
# 一 次 读 取 1KB 的 数据 。 
while data = connection.read(one kb) do 
puts data 


end 


connection.close 
end 


客户 端 连接 : 


X ./code/snippets/write. with. eof.rb 
require 'socket' 


client = TCPSocket.new('localhost', 4481) 
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client.write('gekko') 
client.close 








客户 端 发 送 EOF 最 简单 的 方式 就 是 关闭 自己 的 套 接 字 。 如 果 套 接 字 已 
经 关闭 ， 肯 定 不 会 再 发 送 数据 了 ! 











要 说 起 EOFE， 它 的 名 字 还 是 挺 恰 如 其 分 的 。 当 你 调用 FiLe#read 
时 ( 同 Socket#read 的 行为 方式 类 似 )， 它 会 一 直 进 行 数 据 读 取 ， 
直到 没有 数据 为 止 。 一 旦 读 完整 个 文件 ， 它 会 接收 到 一 个 EOF 事 
件 并 返回 已 读 取 到 的 数据 。 


6.6 ”部 分 读 取 


之 前 我 提 到 过 一 个 术语 “部 分 读 取 ”。 这 也 是 一 种 解决 方案 ， 接 下 来 
我 们 就 来 介绍 一 下 。 

我 们 刚刚 介绍 过 的 那 种 读 取 数据 的 方法 算是 种 懒 办 法 。 当 你 调用 read 
时 ， 在 返回 数据 之 前 它 会 一 直 等 待 ， 直 到 获得 所 需要 的 最 小 长 度 或 是 
EOF。 还 有 男 外 一 种 反 其 道 而 行 的 读 取 方法 。 那 就 是 readpartial。 














readpartial 并 不 会 阻塞 ， 而 是 立刻 返回 可 用 的 数据 。 调 用 
readpartial 时 , 你 必须 传递 一 个 整数 作为 参数 , 来 指定 最 大 的 长 度 。 
readpartial 最 多 读 取 到 指定 长 度 。 如 果 你 指明 读 取 1KB 数 据 , 但 是 
客户 端 只 发 送 了 500B, readpartial 并 不 会 阻塞 , 它 会 立刻 将 已 读 取 
到 的 数据 返回 。 





在 服务 器 端 运行 : 
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# ./code/snippets/readpartial_with_length.rb 
require 'socket' 
one hundred. kb = 1024 * 100 


Socket.tcp. server. 1oop(4481) do lconnectionl 

begin 
# 每 次 读 取 100KB 或 更 少 。 
while data = connection.readpartial(one. hundred. kb) do 

puts data 

end 

rescue EOFError 

end 





connection.close 
end 


结合 以 下 客户 端 命令 : 
$ tail -f /var/log/system.log | nc localhost 4481 


从 中 可 以 看 到 服务 器 会 持续 读 取 一 切 可 用 的 数据 ， 而 不 是 非 要 等 足 
100KB。 只 要 有 数据 ，readpartial 就 会 将 其 返回 ， 即 便 是 小 于 最 大 
长 度 。 





就 EOF 而 言 , readpartial 的 工作 方式 不 同 于 read。 当 接 收 到 EOF 时 ， 
read 仅 仅 是 返回 ， 而 readpartial 则 会 产生 一 个 EOFError 异 常 ， 提 
醒 我 们 要 留心 。 








再 总 结 一 下 : read 很 懒惰 ， 只 会 傻 等 着 ， 以 求 返回 尽 可 能 多 的 数据 。 
相反 ，readpartial 更 勤快 ， 只 要 有 可 用 的 数据 就 立刻 将 其 返回 。 





在 学 习 过 write 之 后 ， 我 们 会 转向 缓冲 区 。 到 那个 时 候 ， 我 们 就 可 以 
回答 一 些 有 意思 的 问题 了 ,例如 : 我 应 该 一 次 性 读 取 多 少数 据 ? 小 读 
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取 量 的 多 次 读 操 作 和 大 读 取 量 的 单 次 读 操 作 究竟 哪 一 种 更 好 ? 


6.7 ”本章 涉及 的 系统 调用 


口 Socket#read 一 read(2)， 行 为 类 似 fread(3) 
口 Socket#readpartial 一 Tead(2) 
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第 7 章 


fH ME 











我 知道 一 些 读者 已 经 想到 了 : 一 个 套 接 字 要 想 读 取 数据 , 男 一 个 套 接 
字 就 必须 写 和 数据! 茶 喜 你 ， 答 对 了 ! 

只 有 一 种 方法 可 以 向 套 接 字 中 写 人 数据 ， 那 就 是 write 方法 。 它 的 用 
法 非常 直观 。 跟 着 直 沉 做 就 行 了 。 

















€ ./code/snippets/write.rb 
require 'socket' 


Socket.tcp. server. 1oop(4481) do lconnectionl 
# 向 连接 中 写 入 数据 的 最 简单 的 方法 。 
connection.write('Welcome!') 
connection.close 

end 





除了 write 调 用 之 外 就 没什么 好 说 的 了 。 在 下 一 章 学 习 缓冲 区 的 时 
候 ， 我 们 将 会 解答 一 些 有 趣 的 问题 。 


本 章 涉及 的 系统 调用 


O SocketZwrite 一 Write(2) 
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在 本 章 中 ， 我 们 会 解答 几 个 重要 的 问题 : 在 一 次 调用 中 应 该 读 / 写 多 
少数 据 ? 如 果 write 成 功 返 回 ， 是否 意味 着 连接 的 男 一 端 已 经 接收 到 
了 数据 ? 是 否 应 该 将 一 个 大 数据 量 的 write 分 割 成 多 个 小 数据 量 进 
行 多 次 写 和 人? 这 样 会 造成 怎样 的 影响 ? 





8.1 Sim 


我 们 先 来 讨论 在 TCP 连 接 上 调用 write 进行 写 人 的 时 候 究 竟 发 生 了 
什么 ? 


当 你 调用 write 并 返回 时 ， 就 算是 没有 引发 异常 ， 也 并 不 代表 数据 已 
经 通过 网 络 顺利 发 送 并 被 客户 端 套 接 字 接收 到 。write 返 回 时 ， 它 只 
是 表明 你 已 经 将 数据 提交 给 了 Ruby 的 IO 系统 和 底层 的 操作 系统 
内 核 。 





在 应 用 程序 代码 和 实际 的 网 络 硬 件 之 间 至 少 还 存在 一 个 缓冲 层 。 让 我 
们 先 来 指明 它们 的 具体 所 在 ,然后 再 来 看 看 如 何 同 它们 打交道 。 
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如 果 write 成 功 返 回 ， 这 仅 能 保证 你 的 数据 已 经 交 到 了 操作 系统 内 核 
的 手中 。 它 可 以 立刻 发 送 数据 ， 也 可 以 出 于 效率 上 的 考虑 暂 不 发 送 ， 
将 其 同 别 的 数据 进行 合并 。 











TCP 套 接 字 默 认 将 sync 设 置 为 true。 这 就 跳 过 了 Ruby 的 内 部 缓冲 ”， 
否则 就 又 要 多 出 一 个 缓冲 层 了 。 


为 何 需要 缓冲 区 ? 

所 有 的 IO 缓冲 都 是 出 于 性 能 的 考虑 ,它们 通常 能 够 显著 提高 性 能 。 
通过 网 络 发 送 数据 的 速度 很 慢 ? ， 相 当 慢 。 缓 冲 使 得 write 调用 可 
以 立刻 返回 。 然 后 在 幕后 由 内 核 将 所 有 还 未 执行 的 写 操作 汇总 到 
一 起 ， 在 发 送 时 进行 分 组 及 优化 ， 在 实现 最 佳 性 能 的 同时 避免 网 
络 过 载 。 在 网 络 层面 上 ， 发 送 大 量 的 小 分 组 会 引发 可 观 的 开销 ， 
因此 内 核 会 将 多 个 小 数据 量 的 写 操作 合并 成 较 大 数据 量 的 写 
操作 。 


8.2 该 写 入 多 少数 据 


鉴于 目前 对 于 缓冲 的 了 解 , 我 们 再 次 摆 出 这 个 问题 : 是 应 该 采用 多 个 
小 数据 量 的 write 调用 还 是 单个 大 数据 量 的 write 调用 ? 





PARME, 我 们 其 实 无 需 考 虑 这 个 问题 。 通 常 你 只 需要 将 用 到 的 
数据 一 股 脑 地 写 入 就 行 了 , 由 内 核 通 过 对 写 操作 进行 分 割 或 合并 来 调 
WERE, 如 此 一 来 便 能 获得 不 错 的 效果 。 如 果 你 要 做 一 个 相当 大 数据 











(D http://jstorimer.com/2012/09/25/ruby-io-buffers.html. 
@ https://gist.github.com/2841832. 
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量 的 write, 比如 文件 或 大 数据 写 入 , 那 最 好 是 将 这 些 数据 进行 分 割 ， 
避免 全 部 载 人 内 存 中 。 





通常 情况 下 , 获得 最 佳 性 能 的 方法 是 一 口气 写 入 所 有 的 数据 ,让 内 核 
决定 如 何 对 数据 进行 结合 。 显 然 , 唯一 需要 做 的 是 优化 你 的 应 用 程序 。 


8.3” 读 缓冲 


不 止 是 写 操作 ， 读 操作 同样 会 被 缓冲 。 

如 果 你 调用 read 从 TCP 连 接 中 读 取 数 据 并 给 它 传递 一 个 最 大 的 读 取 
长 度 ，Ruby 实 际 上 可 能 会 接收 大 于 你 指定 长 度 的 数据 。 

在 这 种 情况 下 ,“ 多 出 的 ”数据 会 被 存储 在 Ruby 内 部 的 读 缓冲 区 中 。 
在 下 次 调用 read 时 ，Ruby 会 完 查 看 自己 的 内 部 缓冲 区 中 有 没有 未 读 
取 的 数据 ， 然 后 再 通过 操作 系统 内 核 请 求 更 多 的 数据 。 








8.4 该 读 取 多 少数 据 
这 个 问题 的 答案 可 不 像 写 缓冲 那样 直观 , 我 们 来 看 看 涉及 的 问题 以 及 
最 佳 实践 。 


因为 TCP 提 供 的 是 数据 流 ， 我 们 无 法 得 知 发 送 方 到 底 发 送 了 多 少数 
据 。 这 就 意味 着 在 决定 读 取 长 度 的 时 候 ， 我 们 只 能 靠 猜 测 。 





为 什么 不 指定 一 个 很 大 的 读 取 长 度 来 确保 总 是 可 以 得 到 所 有 可 用 的 
数据 呢 ? 当 指定 读 取 长 度 时 ,， 内核 会 为 我 们 分 配 一 定 的 内 存 。 如 果 用 
不 着 那么 多 ， 就 会 造成 资源 浪费 。 


图 灵 社 区 会 员 Tiny9458 专 享 尊重 版 权 





48 | 第 8 章 缓冲 


Do omo 它 需要 多 次 才能 够 读 取 完 全 部 的 
数据 。 这 会 导致 每 次 系统 调用 所 引发 的 大 量 开销 问题 
所 以 如 同 大 多 数 事情 一 样 , 如 果 你 根据 应 用 程序 所 要 接收 的 数据 大 小 


来 进行 调 优 , 那么 就 能 获得 最 佳 的 性 能 。 如果 要 接收 大 量 的 大 数据 块 
怎么 办 ? 那 你 可 能 得 指定 一 个 较 大 的 读 取 长 度 。 





这 个 问题 并 没有 万 能 解 药 , 不 过 我 偷 了 点 懒 ,直接 去 研究 了 一 下 使 用 
了 套 接 字 的 各 类 Ruby 项 目 ， 看 看 它们 是 如 何在 该 问题 上 达成 共识 的 。 








我 看 过 Mongrel、Unicorn 、Puma 、Passenger 以 及 Net:HTTP， 它 们 无 
一 例外 地 采用 了 readpartial(1024*16)。 所 有 这 些 Web 项 目 都 是 用 
16KB 作 为 各 自 的 读 取 长 度 。 


然而 ，redis-tb 使 用 1KB 作 为 读 取 长 度 。 


你 总 是 可 以 通过 调 优 服务 器 来 适应 当下 的 数据 量 以 获得 最 佳 的 性 能 ， 
在 犹豫 不 定时 ，16KB 是 一 个 公认 比较 合适 的 读 取 长 度 。 
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第 一 个 客户 端 / 服 务 需 





前 面 几 章 讲述 了 如 何 建 立 连 接 以 及 大 量 有 关 数 据 交 换 的 内 容 。 到 目前 
为 止 我 们 基本 上 都 是 和 一 些小 型 的 、 自 包含 的 代码 片段 小 打 小 阅 , Be 
下 来 该 运用 学 到 的 知识 编写 一 个 网 络 服务 器 和 客户 端 了 。 





9.1 服务 器 


就 这 个 服务 器 而 言 , 我 们 打算 编写 一 种 全 新 的 NoSQL 解决 方案 。 它 将 
作为 Ruby 散 列表 之 上 的 一 个 网 络 层 。 我 们 称 其 为 CloudHash。 








下 面 是 这 个 简单 的 CloudHash 服 务 器 的 完整 实现 : 


# ./code/cloud. hash/server.rb 
require 'socket' 


module CloudHash 
class Server 
def initialize(port) 
# 创建 底层 的 服务 器 套 接 字 。 
@server = TCPServer.new(port) 
puts "Listening on port #{@server.local_address.ip_port}" 
estorage = {} 
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end 


def start 
# qccept 循 环 。 
Socket.accept_loop(@server) do 1connectionl 
handleCconnection) 
connection.close 
end 
end 


def handle(connection) 
E 从 连接 中 进行 读 取 ， 直 到 出 现 EOF。 
request = connection.read 


# 将 hash 操 作 的 结果 写 回 。 
connection.write process(request) 
end 


H 所 支持 的 命令 : 
# SET key value 
# GET key 
def process(request) 
command, key, value - request.split 
case command.upcase 
when 'GET' 
estorage[key] 


when 'SET' 
estorage[key] = value 
end 
end 
end 
end 


server = CloudHash::Server.new(4481) 
server.start 
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X ./code/cloud hash/client.rb 


require 'socket' 


module CloudHash 
class Client 
class «« self 
attr accessor :host, :port 
end 


def self.get(key) 
request "GET #{key}" 


end 


def self.set(key, value) 


request "SET #{key} £Z[value]" 


end 


def self.request(string) 


# 为 每 一 个 请 求 操作 创建 一 个 新 连接 。 
@client = TCPSocket.new(host, port) 


Gclient.write(string) 


X 完成 请 求 之 后 发 送 EOF。 
Gclient.close write 


X 一 直 读 取 到 EOF 来 获取 响应 信息 。 
Gclient.read 


end 
end 
end 
CloudHash::Client.host = 'localhost' 
CloudHash::Client.port - 4481 
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puts CloudHash::Client.set 'prez', 'obama' 
puts CloudHash::Client.get 'prez' 
puts CloudHash::Client.get 'vp' 


9.3 投入 运行 





接 下 来 把 它们 组 装 起 来 投入 运行 吧 ! 
局 动 服务 器 : 


$ ruby code/cloud. hash/server.rb 





别 忘 了 其 中 的 数据 结构 就 是 一 个 散 列 表 。 运 行 客户 端 将 会 执行 以 下 
操作 : 


$ tail -4 code/cloud. hash/client.rb 

puts CloudHash::Client.set 'prez', 'obama' 
puts CloudHash::Client.get 'prez' 

puts CloudHash::Client.get 'vp' 


$ ruby code/cloud. hash/client.rb 


9.3 分 析 


我 们 前 面 都 做 了 些 什 么 ? 我们 使 用 网 络 API 将 Ruby 散 列表 进行 了 包 
装 , 不 过 并 没有 包装 全 部 的 Hash API, ifi Ue ES s ( getter/setter ) 
而 已 。 代码 中 的 不 少 地 方 都 是 些 网 络 编程 的 样板 代码 ， 所 以 应 该 很 容 
易 就 能 看 出 该 如 何 扩展 这 个 例子 ， 以 便 涵 盖 更 多 的 Hash API 











我 对 代码 作 了 注释 , 便于 你 摘 明 白 程 序 的 来 龙 去 脉 ,此 外 我 还 坚持 贯 
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彻 了 我 们 已 经 学 习 过 的 那些 概念 ， 比 如 建立 连接 、EOF 等 。 


但 总 的 来 说 ，CloudHash 还 比较 粗糙 。 前 几 章 我 们 学 习 过 连接 建立 和 数 
据 交 换 的 基础 知识 。 在 这 里 这 些 内 容 都 得 到 了 应 用 。 没有 涉及 的 内 容 是 
有 关 架 构 模 式 的 最 佳 实践 、 设 计 方 法 以 及 一 些 还 没 学 到 的 高 级 特性 。 


比如 说 , 有 没有 注意 到 客户 端 必 须 为 每 一 个 发 送 的 请 求 发 起 一 个 新 的 
连接 ? 如 果 你 想 连 续 发 送 一 批 请 求 ， 那 么 每 个 请 求 都 会 占用 一 个 连 
接 。 我 们 目前 的 服务 咒 设 计 要 求 必 须 如 此 。 它 处 理 一 条 来 自 客 户 端 套 
接 字 的 命令 ， 然 后 关闭 。 











并 非 一 定 要 采用 这 种 处 理 方式 。 建 立 连接 会 引发 开销 ，CLoudHash 完 
全 可 以 在 同一 个 连接 上 处 理 多 个 请 求 。 


有 几 种 改进 的 方法 。 客 户 端 /服务 器 可 以 使 用 一 种 不 需要 发 送 EOF 来 分 
隔 消息 的 简单 消息 协议 进行 通信 。 这 样 可 以 在 单个 连接 上 发 送 多 个 请 
求 ， 而 服务 器 仍旧 是 依次 处 理 每 个 客户 端 连接 。 如 果菜 个 客户 端 要 发 
送 大 量 请 求 或 者 长 时 间 保 持 连接 , 那么 其 他 客户 端 就 无 法 同 服务 需 进 
行 交互 了 。 











我 们 可 以 在 服务 器 中 加 入 某 种 形式 的 并 发 来 解决 这 个 问题 。 本 书 余下 
的 部 分 将 以 目前 你 学 到 的 内 容 作为 基础 ， 致 力 于 帮助 你 编写 出 高 效 、 
易于 理解 、 功 能 完善 的 网 络 程序 。 就 CloudHash 本 身 而 言 ， 并 没有 很 
好 地 展示 如 何 进 行 套 接 字 编程 。 
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Ei ram 








我 们 以 套 接 字 选项 作为 这 一 系列 有 关 套 接 字 高 级 技术 的 章节 的 开始 。 
套 接 字 选项 是 一 种 配置 特定 系统 下 套 接 字 行为 的 低层 手法 。 因 为 涉及 
低层 设置 ， 所 以 Rubpy 并 没有 为 这 方面 的 系统 调用 提供 便捷 的 包装 器 。 




















10.1 SO TYPE 














我 们 先 来 看 看 如 何 获得 套 接 字 类 型 这 一 套 接 字 选项 。 


# ./code/snippets/getsockopt.rb 
require 'socket' 


Socket = TCPSocket.new('google.com', 80) 
E 获得 一 个 描述 套 接 字 类 型 的 Socket: :0ption 实 例 。 
opt = socket.getsockopt(Socket::SOL SOCKET, Socket::SO. TYPE) 


3 将 描述 该 选项 的 整数 值 同 存储 在 Socket: :SOCK_STREAM 中 的 整数 值 进行 比较 。 
opt.int == Socket::SOCK_STREAM #=> true 
opt.int == Socket::SOCK_DGRAM #=> false 


getsockopt 返 回 一 个 Socket: :0ption 实 例 。 在 这 个 层面 上 进行 操作 
时 ， 所 有 一 切 都 被 转化 成 了 整数 。 因 此 Socket0Option#int 可 以 获得 





图 灵 社区 会 员 Tiny9458 专 享 尊重 版 权 


邮 


10.2 SO REUSE ADDR | 55 





与 返回 值 相关 联 的 底层 的 整数 值 。 














在 这 里 我 获得 的 是 套 接 字 类 型 ( 记得 吧 , 创建 第 一 个 套 接 字 时 就 指定 
了 这 个 类 型 )， 所 以 将 int 值 同 各 种 Socket 类 型 常量 进行 比较 ， 结 
发 现 这 是 一 





个 STREAM 套 接 字 。 


记 住 Ruby 总 是 会 提供 便于 记忆 的 符号 来 代替 这 些 常量 。 上 面 的 代码 也 
可 以 写成 这 样 : 


# ./code/snippets/getsockopt_wrapper .rb 
require 'socket' 


socket = TCPSocket.new('google.com', 80) 
4 使 用 符号 名 而 不 是 常量 。 
opt = socket.getsockopt(:SOCKET, :TYPE) 


10.2 SO. REUSE. ADDR 


这 是 每 个 服务 顺 都 应 该 设置 的 一 个 常见 选项 。 


SO_REUSE_ADDR 选 项 告诉 内 核 : 如 果 服 务 如 当前 处 于 TCP 的 
TIME_WAIT 状 态 ， 即 便 另 一 个 套 接 字 要 绑 定 (bind) 到 服务 占 目 前 所 
使 用 的 本 地 地 址 也 无 妨 。 


TIME_WAIT 状 态 
当 你 关闭 (close) 了 某 个 缓冲 区 ， 但 其 中 仍 有 未 处 理 数 据 的 套 
接 字 之 时 就 会 出 现 TIME_WAIT 状 态 。 前 面 曾 说 过 ， 调 用 Write 只 
是 保证 数据 已 经 进入 了 缓冲 层 。 当 你 关闭 一 个 套 接 字 时 ， 它 未 处 
理 的 数据 并 不 会 被 丢弃 。 
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在 幕后 ， 内 核 使 连接 保持 足够 长 的 打开 时 间 ， 以 便 将 未 处 理 的 数 
CAE 这 就 意味 着 它 必 须发 送 数 据 ， 然 后 等 待 接收 方 的 确 
认 ， 以 免 数 据 需 要 重 传 。 


如 果 关 闭 一 个 尚 有 数据 未 处 理 的 服务 器 并 立刻 将 同一 个 地 址 绑 定 
到 另 一 个 套 接 字 上 (比如 重启 服务 器 )， 则 会 引发 一 个 
Errno::EADDRINUSE, ， 除 非 未 处 理 的 数据 被 丢弃 掉 。 设 置 
SO_REUSE_ADDR 可 以 绕 过 这 个 问题 ， 使 你 可 以 绑 定 到 一 个 处 于 
TIME_WAIT 状 态 的 套 接 字 所 使 用 的 地 址 上 。 





下 面 是 打开 该 选项 的 方法 : 


€ ./code/snippets/reuseaddr.rb 
require 'socket' 


server = TCPServer.new('localhost', 4481) 
server.setsockopt(:SOCKET, :REUSEADDR, true) 


server.getsockopt(:SOCKET, :REUSEADDR) #=> true 


i, TCPServer.new, Socket.tcp server. loop/A X 3&4 $5 
方法 默认 都 打开 了 此 选项 。 


可 以 通过 setsockopt(2) 查 看 系统 上 可 用 的 套 接 字 选项 的 完整 列表 。 





10.3 本章 涉及 的 系统 调用 


口 Socket£setsockopt 一 setsockopt(2) 





口 Socket#getsockopt 一 getsockopt(2) 
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第 11 章 


非 阻 赛 式 IO 











本 章 是 关于 非 阻 塞 式 IO 的 内 容 。 它 与 异步 式 或 事件 驱动 式 IO 不 同 。 如 
果 你 还 不 了 解 其 中 的 差别 , 那么 随 着 书 中 后 面部 分 的 学 习 , 一 切 都 会 


AE SHE 
变 得 清晰 。 








非 阻 塞 式 IO 同 下 一 章 要 介绍 的 连接 复 用 之 间 的 关系 非常 紧密 , 不 过 我 
打算 先 讲述 前 者 ， 因 为 非 阻塞 式 IO 本 身 就 已 经 能 独当一面 了 。 





11.1. 非 阻塞 式 读 操作 





还 记得 我 们 之 前 学 过 的 read 吗 ? 我 提 到 过 read 会 一 直 保持 阻塞 ， 直 
到 接收 到 EOF 或 是 获得 指定 的 最 小 字 节 数 为 止 。 如 果 客 户 端 没 有 发 送 
EOF, 就 可 能 会 导致 阻塞 。 这 种 状况 可 以 通过 reaqadpartiaqL 和 暂时 解决 ， 
readpartial 会 立即 返回 所 有 的 可 用 数据 。 但 如 果 没 有 数据 可 用 ，, 那 
么 readpartial 仍 旧 会 陷入 拥 寒 。 如 果 需 要 一 种 不 会 阻塞 的 读 操 作 ， 
可 以 使 用 read_nonblock。 

















和 readpartial 非 常 类 似 ,read_nonblock 需 要 一 个 整数 的 参数 , 指 
定 需要 读 取 的 最 大 字 节 数 。 记 住 read_nonblock 和 readpartial 一 
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样 ， 如 果 可 用 的 数据 小 于 最 大 字 节 数 , 那 就 只 返回 可 用 数据 。 代 码 演 
示 如 下 : 


X ./code/snippets/read_nonblock.rb 
require 'socket' 


Socket.tcp. server. 1o0op(4481) do lconnectionl 
loop do 
begin 
puts connection.read. nonblock(4096) 
rescue Errno: : EAGAIN 
retry 
rescue EOFError 
break 
end 
end 


connection.close 
end 


局 动 之 前 用 过 的 那个 客户 端 ， 一 直 保持 连接 打开 : 





$ tail -f /var/log/system.log | nc localhost 4481 


即便 没有 向 服务 器 发 送 数 据 ，read_nonblock 调 用 仍然 会 立即 返回 。 
事实 上 ， 它 产生 了 一 个 Errno: :EAGAIN 异 常 。 下 面 是 手册 页 中 关于 
EAGAIN 的 描述 


文件 被 标记 用 于 非 阻塞 式 JO， 无 数据 可 读 。 


原来 是 这 么 回 事 。 这 不 同 于 readpartial， 后 者 在 这 种 情况 下 会 


FE 
基 。 





E 











如 果 你 碰 上 了 这 种 错误 该 怎么 办 ?” 套 接 字 是 否 会 阻塞 ?在 本 例 中 , 我 
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们 进入 一 个 忙 循环 并 不 停 地 重 试 ( retry )。 不 过 这 仅 出 于 演示 目的 ， 
而 并 非 正确 的 做 法 。 





对 被 阻塞 的 读 操 作 进 行 重 试 的 正确 做 法 是 使 用 I0. select: 


begin 
connection.read. nonblock(4096) 
rescue Errno: :EAGAIN 
IO.select([connection]) 
retry 
end 


上 面 的 代码 可 以 实现 的 功能 同 之 前 那 种 堆砌 了 大 量 read_nonblock 
与 retry 的 代码 一 样 ， 但 却 去 掉 了 不 必要 的 循环 。 使 用 套 接 字 数组 作 
为 I0.select 调 用 的 第 一 个 参数 将 会 造成 阻塞 , 直到 其 中 的 某 个 套 接 
字 变 得 可 读 为 止 。 所 以 应 该 仅 当 套 接 字 有 数据 可 读 时 才 调用 retry。 
在 下 一 章 我 们 会 更 细致 地 讲解 I0. select。 











c— 




















在 本 例 中 ， 我 们 使 用 非 阻 塞 方法 重新 实现 了 阻塞 式 的 read 方 法 。 这 
本 身 并 没有 什么 用 处 。 但 是 I0. select 提 供 了 一 种 灵活 性 , 可 以 在 进 
行 其 他 工作 的 同时 监控 多 个 套 接 字 或 是 定期 检查 它们 的 可 读 性 。 




















什么 时 候 读 操作 会 阻塞 ? 
read_nonblock 方 法 首先 检查 Ruby 的 内 部 缓冲 区 中 是 否 还 有 未 
处 理 的 数据 。 如 果 有 ， 则 立即 返回 。 


然后 ，read_nonblock 会 询问 内 核 是 否 有 其 他 可 用 的 数据 可 供 
select(2) 读 取 。 如 果 答 案 是 肯定 的 , 不 管 这 些 数据 是 在 内 核 缓冲 区 
还 是 网 络 中 ， 它 们 都 会 被 读 取 并 返回 。 其 他 情况 都 会 使 read(2) 阻 
塞 并 在 read_nonblock 中 引发 异常 。 


图 灵 社 区 会 员 Tiny9458 专 享 尊重 版 权 





60 %11%  dEPHSEXLIO 


11.2 3EBH3ESU E HRE 








非 阻 塞 式 写 操作 同 我 们 之 前 看 到 的 write 调用 有 多 处 重要 的 不 同 。 最 
明显 的 一 处 是 : write_nonblock 可 能 会 返回 部 分 写 人 的 结果 ， 而 
write 调 用 总 是 将 你 发 送 给 它 的 数据 全 部 写 入 。 


下 面 使 用 netcat 启 动 一 个 临时 服务 器 来 演示 这 种 行为 : 
$ nc -l localhost 4481 
然后 再 启动 一 个 采用 了 write_nonblock 的 客户 端 : 


# ./code/snippets/write_nonblock.rb 
require 'socket' 


client = TCPSocket.new('localhost', 4481) 
payload - 'Lorem ipsum' * 10. 000 


written = client.write. nonblock(payload) 
written < payload.size #=> true 


当 运 行 这 两 个 程序 时 ， 从 客户 端 处 打印 出 了 true。 也 就 是 说 它 返 回 了 
一 个 整数 值 , 这 个 值 小 于 负载 (payload ) 数据 的 长 度 。write_nonblock 
方法 之 所 以 返回 , 是 因为 碰 上 了 某 种 使 它 出 现 阻 塞 的 情况 ,因此 也 就 
没 法 进行 写 和 人 ,所 以 返回 了 整数 值 ， 告诉 我 们 写 人 了 多 少数 据 。 接 下 
来 我 们 要 负责 将 还 未 发 送 的 数据 继续 写 人 。 











write_nonblock 的 行为 和 系统 调用 write(2) 一 模 一 样 。 它 尽 可 能 多 地 
写 人 数据 并 返回 写 人 的 数量 。 和 Ruby 的 write 方 法 不 同 的 是 , 后 者 可 
能 会 多 次 调用 write(2) 写 人 所 有 请 求 的 数据 。 
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如 果 一 次 调用 没 法 写 人 所 有 请 求 的 数据 , 那 该 怎么 办 ?显然 应 该 试 着 
继续 写 和 人 没完 成 的 部 分 。 但 别 急 着 立刻 下 手 。 如 果 底 层 的 write(2) 仍 
处 于 阻塞 ， 那 你 会 得 到 一 个 Errno: :EAGAIN 异 常 。 最 终 还 是 得 靠 
IO.select, 它 可 以 告诉 我 们 何 时 某 个 套 接 字 可 写 , 这 意味 着 可 以 无 
阻塞 地 进行 写 人 。 
































4 ./code/snippets/retry. partial write.rb 
require 'socket' 


client = TCPSocket.new('localhost', 4481) 
payload - 'Lorem ipsum' * 10. 000 


begin 
loop do 
bytes = client.write nonblock(payload) 


break if bytes >= payload.size 
payload.slice!(0, bytes) 
IO.select(nil, [client]) 

end 


rescue Errno: :EAGAIN 
IO.select(nil, [client]) 
retry 

end 





这 里 我 们 将 一 个 套 接 字数 组 作为 I0.select 的 第 二 个 参数 ， 这 样 


IO.selectZ— HHE, HF 











N: 


其 中 的 某 个 套 接 字 可 以 写 入 。 








例子 中 的 循环 语句 正确 地 处 理 了 部 分 写 操 作 。 当 write_nonblock 返 
回 一 个 小 于 负载 长 度 的 整数 时 ,我们 将 这 部 分 数据 从 负载 中 截 去 , 然 
后 等 套 接 字 再 次 可 写 时 ， 重 新 执行 循环 。 








图 灵 社 区 会 员 Tiny9458 专 享 尊重 版 权 





62 第 11 章 ” 非 阻 塞 式 IO 


什么 时 候 写 操作 会 阻塞 ? 
底层 的 write(2) 在 下 述 两 种 情况 下 会 阻塞 。 


而 发 送 方 已 
经 发 送 了 所 允许 发 送 的 数据 量 。 TCP 使 用 拥塞 控制 算法 确保 网 
络 不 会 被 分 组 所 海 没 。 如果 数 据 花 费 了 很 长 时 间 才 到 达 TCP 连 
接 的 接收 端 ， 那 么 要 注意 不 要 发 送 超出 网 络 处 理 能 力 的 数据 ， 
mdi 
(2) TCP 连 接 的 接收 端 无 力 处 理 更 多 的 数据 。 即 便 是 另 一 端 已 经 确 
认 接 收 到 了 数据 ， 它 仍 必须 清空 自己 的 数据 窗口 ,以便 重 新 填 
入 其 他 数据 。 这 就 涉及 内 核 的 读 缓 冲 区 。 如 果 接 收 端 没有 处 理 
它 接 收 的 数据 ,那么 拥塞 控制 算法 会 强制 发 送 端 阻塞 , 直到 客 
户 端 可 以 接收 更 多 的 数据 为 止 。 


11.3” 非 拥塞 式 接收 


尽管 非 阻 塞 式 的 read 和 write 用 得 最 多 , 但 除了 它们 之 外 ， 别 的 方法 
也 有 非 阻塞 形式 。 





aqccept_nonblock 和 普通 的 accept 几 乎 一 样 。 还 记 不 记得 我 当时 说 
过 accept 只 是 从 侦 听 队列 中 弹出 一 个 连接 ? 如 果 侦 听 队 列 为 空 ， 那 
aqccept 就 得 阻塞 了 。 而 accept_nonblock 就 不 会 阻塞 ， 只 是 产生 一 
个 Errno: :EAGAIN。 

















加 果 发 送 时 间 过 长 ， 可能 是 内 为 网 络 出 现 了 拥塞， 那么 这 时 就 应 该 减少 数据 发 送 
， 避 免 加 剧 拥塞 。 译 者 注 





"i 
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下 面 是 一 个 例子 : 


# ./code/snippets/accept_nonblock.rb 
require 'socket' 


server = TCPServer.new(4481) 


loop do 
begin 
connection = server.accept nonblock 
rescue Errno: : EAGAIN 
# 执行 其 他 重要 的 工作 。 
retry 
end 
end 


11.4” 非 拥塞 式 连接 


看 看 你 现在 能 不 能 猿 出 connect_nonblock 方 法 的 用 途 ? 结果 可 能 会 
有 点 出 乎 你 的 意料 ! connect_nonblock 的 行为 和 其 他 的 非 阻塞 式 IO 
方法 有 些 不 同 。 











其 他 方法 要 么 是 完成 操作 ， 要 么 是 产生 一 个 对 应 的 异常 ， 而 
conncet_nonblock 则 是 保持 操作 继续 运行 ， 并 产生 一 个 异常 。 





如 果 connect_nonblock 不 能 立即 发 起 到 远程 主机 的 连接 ， 它 会 在 后 
台 继 续 执行 操作 并 产生 Errno: :EINPROGRESS, 提醒 我 们 操作 仍 在 进 
行 中 。 下 一 章 会 讲解 如 何 得 知 后 台 操 作 已 经 完成 。 现 在 来 看 一 个 简短 
的 例子 : 





图 灵 社区 会 员 Tiny9458 GF 尊重 版 权 





64 %11% 非 阻塞 式 1O 


€ ./code/snippets/connect. nonblock.rb 
require 'socket' 


socket = Socket.new(:INET, :STREAM) 
remote addr = Socket.pack sockaddr. in(80, 'google.com') 


begin 
# 在 端口 80 向 google .com 发 起 一 个 非 阻塞 式 连 接 。 
Socket.connect. nonblock(remote. addr) 
rescue Errno: : EINPROGRESS 
# 操作 在 进行 中 。 
rescue Errno: : EALREADY 
# 之 前 的 非 阻塞 式 连接 已 经 在 进行 当中 。 
rescue Errno::ECONNREFUSED 
# 远程 主机 拒绝 连接 。 
end 
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连接 复 用 








连接 复 用 是 指 同时 处 理 多 个 活动 套 接 字 。 这 并 不 是 指 并 行 处 理 ,也 和 





多 线程 无 关 。 后 面 会 用 例子 解释 这 一 点 。 


根据 目前 所 学 到 的 技术 , 想象 一 下 应 该 怎么 编写 一 个 需要 





随时 处 理 多 


条 TCP 连 接 中 的 可 用 数据 的 服务 絮 。 我 们 可 能 会 利用 刚 学 到 的 有 关 非 








阻塞 式 IO 的 知识 来 避免 在 特定 的 套 接 字 上 陷入 停 济 。 


# ./code/snippets/naive_multiplexing.rb 


H 创建 一 个 连接 数组 。 


connections = [«TCPSocket», «TCPSocket», «TCPSocket»] 


Ë 进入 无 限 循环 。 
loop do 
# 处 理 每 个 连接 …… 
connections.each do lconnl 
begin 
3 采用 非 阻 塞 的 方式 从 每 个 连接 中 进行 读 取 ， 
E 处 理 接收 到 的 任何 数据 ， 不 然 就 尝试 下 一 个 连接 。 
data = conn.read. nonblock(4096) 
process(data) 
rescue Errno: :EAGAIN 
end 
end 
end 
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这 行 得 通 吗 ?当然 ! 不 过 需要 频繁 地 执行 循环 。 


每 一 次 调用 read_nonblock 都 要 使 用 至 少 一 个 系统 调用 , 如 果 没 有 数 
Ju. 服务 器 会 浪费 大 量 的 处 理 周期 。 如 前 所 述 ，read_nonblock 
使 用 select(2) 检 查 是 否 有 可 用 数据 。 而 有 一 个 Ruby 包 装 器 ， 可 以 让 我 
们 按照 自己 的 意图 直接 使 用 select(2)。 








12.1 select(2) 


下 面 是 处 理 多 个 TCP 连 接 中 可 用 数据 的 更 好 的 方法 : 


# ./code/snippets/sane_multiplexing.rb 
7 创建 一 个 连接 数组 。 
connections = [«TCPSocket», «TCPSocket», «TCPSocket»] 


loop do 
# 查询 select(2) 哪 一 个 连接 可 以 进行 读 取 了 。 
ready = IO.select(connections) 


E 从 可 用 连接 中 进行 读 取 。 
readable. connections = ready[0] 
readable. connections.each do 1connl 
data = conn.readpartial(4096) 
process(data) 
end 
end 


个 例子 使 用 I0.select 极 大 地 降低 了 处 理 多 个 连接 的 开销 。 
IO. ee e 然后 告知 哪 一 个 可 以 进行 读 
写 ， 这 样 你 就 不 必 再 像 刚才 那样 腾 子 摸 象 了 。 





来 看 一 看 I0.select 的 一 些 属 


"uni 
x 


性 。 
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它 可 以 告诉 你 文件 描述 符 何 时 可 以 读 写 。 在 上 面 的 例子 中 我 们 只 给 
I0.select 传 递 了 一 个 参数 ， 但 实际 上 I0.select 可 以 使 用 3 个 数组 
作为 参数 。 

# ./code/snippets/select. args.rb 


for. reading = [«TCPSocket», «TCPSocket», «TCPSocket»] 
for writing = [«TCPSocket», «TCPSocket», «TCPSocket»] 


IO.select(for. reading, for writing, for writing) 


第 一 个 参数 是 希望 从 中 进行 读 取 的 I0 对 象 数组 ,第 二 个 参数 是 希望 进 
行 写 入 的 10 对 象 数 组 。 第 三 个 参数 是 在 异常 条 件 下 使 用 的 10 对象 数 
组 。 大 多 数 应 用 程序 可 以 忽略 第 三 个 参数 ， 除 非 你 对 带 外 数据 
( out-of-band data ) 感 兴趣 。( 第 18 章 会 详 述 这 方面 的 内 容 o 要 注意 的 
是 , 就算 你 只 打算 从 单个 I0 对 象 中 读 取 , 你 也 得 把 它 放 到 一 个 数组 中 
传递 给 I0. select。 

















它 返 回 一 个 数组 的 数组 。I0.select 返 回 一 个 包含 了 3 个 元 素 的 髓 套 
数组 , 分 别 对 应 它 的 参数 列表 。 第 一 个 元 素 包 含 了 可 以 进行 无 拥塞 读 
取 的 I0 对 象 。 注意 , 这 是 I0. select 首 个 参数 的 I0 对 象 数 组 的 一 个 子 
集 。 第 二 个 元 素 包 含 了 可 以 进行 无 拥塞 写 人 的 10 对象 , 第 三 个 元 素 包 
含 了 适用 异常 条 件 的 对 象 。 














# ./code/snippets/select_returns.rb 
for_reading = [<TCPSocket>, <TCPSocket>, <TCPSocket>] 
for writing = [<TCPSocket>, <TCPSocket>, <TCPSocket>] 


ready = IO.select(for. reading, for writing, for writing) 
E 对 于 每 个 作为 参数 传 入 的 数组 均 会 返回 一 个 数组 。 


# 在 这 里 ，for_writing 中 没有 连接 可 写 ，for_reading 中 有 一 个 连接 可 读 。 
p ready #=> [[«TCPSocket»], [1], [J] 
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它 会 阻塞 。I0.select 是 一 个 同步 方法 调用 。 按 照 目 前 的 方法 来 使 
它 会 造成 阻塞 ， puc Ie i 这 时 它 会 
立刻 返回 。 如 果 多 个 对 象 状态 发 生变 化 ， 那 么 全 部 都 通过 帜 套数 组 











I0.select 还 有 第 四 个 参数 : 一 个 以 秒 为 单位 的 超时 值 。 它 可 以 避免 
I0.select 永 久 地 阻塞 下 去 。 传 人 一 个 整数 或 浮 点 值 指定 超时 。 如 果 
在 I0 状 态 发 生变 化 之 前 就 已 经 超时 ， 那 么 I0.select 会 返回 nil。 





X ./code/snippets/select timeout.rb 
for. reading = [«TCPSocket», «TCPSocket», «TCPSocket»] 
for writing = [«TCPSocket», «TCPSocket», «TCPSocket»] 


timeout - 10 
ready = IO.select(for. reading, for writing, for. writing, 
timeout) 


# 在 这 里 I0.select 在 10 秒 钟 内 没有 检测 到 任何 状态 的 改变 ， 
X 因此 返回 nil， 而 非 谋 套 数组 。 
p ready #=> nil 


你 也 可 以 传递 纯 Ruby 对 象 给 I0.seLect， 只 要 它们 适用 于 to_io 
并 能 返回 一 个 I0 对 象 。 这 样 也 有 好 处 ， 如 此 一 来 你 就 无 需 维 护 I0 
对 象 到 领域 对 象 的 映射 了 。 如 果实 现 了 to_io 方 法 ，I0.select 
就 可 以 使 用 纯 Ruby 对 象 了 。 


12.2 读 / 写 之 外 的 事件 





我 们 已 经 学 习 了 如 何 使 用 I0.select 监 视 套 接 字 的 读 写 状态 , 实际 上 
它 也 可 以 用 于 其 他 一 些 地 方 。 
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12.2.1 EOF 

如 果 你 在 监视 某 个 套 接 字 的 可 读 性 时 ， 它 接收 到 了 一 个 EOF， 那 么 该 
套 接 字 会 作为 可 读 套 接 字数 组 的 一 部 分 被 返回 。 在 对 其 进行 读 取 时 ， 
取决 于 当时 所 使 用 的 read(2) 的 版 本 ， 可 能 会 得 到 一 个 EOFError 或 ni1。 














12.2.2 accept 

如 果 你 在 监视 某 个 服务 器 套 接 字 的 可 读 性 时 , 它 收 到 了 一 个 接 入 的 连 
接 , 那么 该 套 接 字 会 作为 可 读 套 接 字 数组 的 一 部 分 返回 。 显 然 你 需要 
对 这 种 套 接 字 进行 特殊 处 理 ， 应 该 使 用 accept 而 非 read。 

















12.2.3 connect 

这 大 概算 得 上 是 最 有 意思 的 部 分 了 。 上 一 章 我 们 学 习 了 
connect_nonblock， 了 解 到 如 果 它 不 能 立刻 完成 连接 ， 则 会 产生 
Errno: :EINPROGRESS。 我 们 可 以 使 用 I0.select 了 解 后 台 连 接 是 否 
已 经 完成 : 




















# ./code/snippets/multiplexing_connect.rb 
require 'socket' 


Socket = Socket.new(:INET, :STREAM) 
remote addr = Socket.pack sockaddr. in(80, 'google.com') 


begin 
Z4 X 5|google.coms5 v 8085 4E ra. 2c 3 36 4 
Socket.connect. nonblock(remote. addr) 
rescue Errno: : EINPROGRESS 
IO.select(nil, [socket]) 


begin 
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Socket.connect. nonblock(remote. addr) 
rescue Errno: : EISCONN 
# 成 功 ! 
rescue Errno: :ECONNREFUSED 
H 被 远程 主机 拒绝 。 
end 
end 


这 段 代 码 的 第 一 部 分 和 上 一 章 的 样 。 尝 试 进 行 connect_ 
Dn eid : EINPROGRESS , 这 意味 着 连接 过 程 发 生 在 后 
。 接 着 看 新 代码 部 分 。 














我 们 利用 I0. select 监 视 套 接 字 状 态 是 否 变 得 可 写 。 如 果 发 生 改 变 ， 
就 可 以 确定 底层 的 连接 已 经 完成 。 为 了 获知 状态 , 我 们 只 需要 再 次 试 
用 connect_nonblock 即 可 ! 如 果 它 产生 了 Errno: :EISCONN， 就 表 
明 套 接 字 已 经 连接 到 了 远程 主机 。 搞定 ! 其 他 异常 表明 连接 远程 主机 
时 出 现 了 错误 。 


























这 段 特别 的 代码 实际 上 模拟 了 阻塞 式 的 connect 。 为 什么 要 这 样 ? 部 
分 原因 是 为 了 展示 可 以 用 它 做 些 什么 ， 你 也 可 以 像 这 样 编写 自己 的 
代码 。 你 可 以 发 起 connect_nonblock， 撒 手 去 做 其 他 工作 ， 随 后 调 
用 带 超 时 参数 的 I0 .select。 如 果 底 层 的 连接 还 没有 完成 , 你 可 以 继 
续 做 别 的 事 ， 随 后 再 检查 I0. select。 





实际 上 我 们 可 以 利用 这 个 小 技巧 使 用 Ruby 编 写 一 个 非常 简单 的 端口 
RA 端口 扫描 器 试图 连接 远程 主机 某 个 端口 区 域内 的 所 有 端口 ， 
告诉 你 哪些 端口 是 开放 的 ， 可 以 连接 。 





(D http://en.wikipedia.org/wiki/Port scanner. 
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# ./code/port_scanner.rb 
require 'socket' 


HOW A 

PORT. RANGE = 1..128 
HOST = 'archive.org' 
TIME. TO. WAIT = 5 # 4 


## 为 每 个 端口 创建 一 个 套 接 字 并 发 起 非 阻塞 式 连接 。 
Sockets = PORT. RANGE.map do lportl 
socket = Socket.new(:INET, :STREAM) 
remote addr = Socket. sockaddr. in(port, 'archive.org') 


begin 

Socket.connect. nonblock(remote. addr) 
rescue Errno: : EINPROGRESS 
end 


socket 
end 


# 设置 期 限 。 
expiration = Time.now + TIME_TO_WAIT 


loop do 
# 我 们 每 次 调用 I0.select 并 调整 超时 值 ， 这 样 永远 都 不 会 超期 。 
_, writable, _ = IO.select(nil, sockets, nil, expiration - 
Time.now) 


break unless writable 


writable.each do lsocket| 

begin 
socket.connect nonblock(socket.remote. address) 

rescue Errno: :EISCONN 
# 如 果 套 接 字 已 经 连接 ， 那 么 我 们 就 将 此 视 为 一 次 成 功 。 
puts "#{HOST}:#{socket.remote_address.ip_port} accepts 

connections..." 

# 将 套 接 字 从 列表 中 移 去 ， 这 样 就 不 会 再 被 选 作 可 写 的 套 接 字 。 
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sockets.delete(socket) 
rescue Errno::EINVAL 
sockets.delete(socket) 
end 
end 
end 


这 段 代 码 利用 connect_nonblock 一 次 性 发 起 了 几 百 个 连接 ， 然 后 使 
HIO. select 对 它们 进行 监视 并 确认 哪 一 个 连接 能 够 顺利 完成 。 下 面 





是 我 在 archive.org 上 运行 的 输出 结 


archive.org:25 accepts connections... 
archive.org:22 accepts connections... 
archive.org:80 accepts connections... 
archive.org:443 accepts connections... 


注意 ,结果 未 必 是 有 序 的 。 先 完成 处 理 的 连接 被 先 打 印 出 来 。 这 是 一 
组 很 常见 的 开放 端口 ,端口 25 保 留用 于 SMTP， 端 口 22 保 留用 于 SSH， 


端口 80 保 留用 于 HTTP， 端 口 443 保 留用 于 HTTPS。 


12.3 ”高 性 能 复 用 





I0.select 来 自 Ruby 的 核心 代码 库 。 它 是 在 Ruby 中 进行 复 用 的 唯 











手段 。 大 多 数 现代 操作 系统 支持 多 种 复 用 方法 。select(2) 几 乎 总 是 这 





些 方法 中 最 古老 ， 也 是 用 得 最 少 的 那个 。 








I0.select 在 少数 情况 下 表现 还 不 错 , 但 是 其 性 能 同 它 所 监视 的 连接 
数 呈 线性 关系 。 监 视 的 连接 数 越 多 ， 人 性 能 就 越 差 。 而 且 select(2) 系 统 
调用 受到 FD_SETSIZE 的 限制 ， 它 是 一 个 定义 在 你 本 地 C 代 码 库 中 的 
宏 。select(2) 无 法 对 编号 大 于 FD_SETSIZE (在 多 数 系统 上 这 个 数字 是 
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1024 ) 的 文件 描述 符 进 行 监视 。 因 此 I0.select 最 多 只 能 监视 1024 个 
I0 对 象 。 





poll(2) 系 统 调用 与 select(2) 略 有 不 同 ， 不 过 这 点 不 同 也 仅 限 于 表面 而 
已 。Linux 的 epoll(2) 以 及 BSD 的 kqueue(2) 系 统 调用 比 select(2) 和 pol1(2) 
效果 更 好 、 功 能 更 先进 。 像 EvenMachine 这 种 高 性 能 联网 工具 在 可 能 
的 情况 下 更 倾向 于 使 用 epoll(2) 或 Kkqueue(2)。 





我 不 打算 给 出 这 些 特定 的 系统 调用 的 例子 ,我 向 你 推荐 一 个 叫做 
nio4r 的 Ruby gem"， 它 为 所 有 这 些 复 用 方法 提供 了 一 个 通用 的 接口 ， 
便于 使 用 系统 中 性 能 最 好 的 可 用 方法 。 





(D https://github.com/tarcieri/nio4r. 
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Nagle 算 法 








Nagle 算 法 是 一 种 默认 应 用 于 所 有 的 TCP 连 接 的 优化 。 

这 种 优化 最 适合 那些 不 进行 缓冲 、 每 次 只 发 送 很 小 数据 量 的 应 用 程 
序 。 因 而 该 算法 通常 被 不 满足 这 些 条 件 的 服务 器 禁用 。 接 下 来 看 一 下 
这 个 算法 。 








程序 向 套 接 字 执行 写 操作 之 后 ， 有 下 面 3 种 可 能 的 结 





(1) 如 果 本 地 缓冲 区 中 有 足够 的 数据 可 以 组 成 一 个 完整 的 TCP 分 组 ”， 
那么 就 立即 发 送 。 


(2) 如 果 本 地 缓冲 区 中 没有 尚未 处 理 的 数据 ， 接 收 端的 数据 也 都 全 部 
已 经 确认 接收 ,那么 就 立即 发 送 。 


(3) 如 果 接 收 端 还 有 未 确定 的 答复 (acknowledgement )， 也 没有 足够 
的 数据 组 成 一 个 完整 的 TCP 分 组 , 那么 就 将 数据 放 人 本 地 缓冲 区 。 


该 算法 避免 了 发 送 大 量 的 微型 TCP 分 组 问题 。 它 最 初 是 设计 用 来 解决 

















(D 也 称 作 foll-size segment。 它 的 具体 大 小 由 接收 方 的 MSS (Maximum Segment Size ) 
决定 。 一 一 译 者 注 
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像 telnet 这 种 协议 所 存在 的 问题 : 在 telnet 中 ， 伴 随 着 每 次 击 键 ， 字 符 
就 会 立刻 发 送 到 网 络 上 。 





如 果 你 使 用 的 是 HTTP 协 议 , 它 的 请 求 /响应 至 少 够 组 成 一 个 TCP 分 组 ， 
因此 Nagle 算 法 除了 会 延缓 最 后 一 个 分 组 发 送 之 外 ， 一 般 不 会 造成 什 
么 影响 。 该 算法 旨 在 避免 在 某 些 极 特定 的 情况 下 搬 石头 砸 自己 的 脚 ， 
比如 在 实现 telnet 时 。 考 虑 到 Ruby 的 缓冲 以 及 在 TCP 之 上 所 实现 的 大 
部 分 常见 的 协议 ， 你 可 能 希望 禁用 Nagle 算 法 。 

例如 ， 每 个 Ruby Web 服 务 器 都 禁用 了 该 选项 。 禁 用 方法 如 下 : 


# ./code/snippets/disable. nagle.rb 
require 'socket' 


server = TCPServer.new(4481) 


# 禁用 Nagle 算 法 。 告 诉 服务 器 不 带 延 迟 ， 即 时 发 送 。 
server.setsockopt(Socket::IPPROTO TCP, Socket::TCP_NODELAY, 1) 
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有 件 事 我 们 到 现在 都 没有 谈 起 , 那 就 是 如 何 将 服务 器 与 客户 端 之 间 交 
换 的 消息 进行 格式 化 。 





CloudHash 存 在 的 一 个 问题 是 , 客户 端 必须 为 发 送 到 服务 器 的 每 条 命 
令 打开 一 个 新 连接 。 主 要 的 原因 是 客户 端 /服务 器 并 没有 一 致 的 方式 
来 划分 消息 的 起 止 位 置 ， 所 以 只 能 退 而 求 次 , 使 用 EOF 来 表明 消息 的 
终止 。 











尽管 这 样 也 算 把 问题 搞定 了 , 但 是 并 不 理想 。 为 每 条 命令 打开 一 个 间 
连接 增加 了 不 必要 的 开销 。 你 可 以 在 同一 个 TCP 连 接 上 发 送 多 条 消 
息 , 但 如 果 你 不 打算 关闭 连接 , 那 就 需要 有 某 种 方式 来 表明 消息 之 间 
的 起 止 。 














多 条 消息 重用 连接 的 想法 同 我 们 所 熟悉 的 HITP keep-alive 特 性 背 
后 的 理念 是 一 样 的 。 在 多 个 请 求 间 保持 连接 开放 ( 包括 客户 端 和 服 
务 器 协商 的 划分 消息 的 方法 ), 通过 避免 打开 新 的 连接 来 节省 资源 。 





说 白 了 ， 有 无 数 种 方法 可 以 用 于 在 消息 间 进 行 划 分 。 一 些 很 复杂 , 一 
些 很 简单 。 取 决 于 你 想 如 何 格式 化 消息 。 
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协议 与 消息 
我 一 直 在 谈论 消息 ， 它 和 协议 并 不 是 一 回 事 。 比 如 说 ，HTTP 协 议 
既定 义 了 消息 边界 ( 连续 的 新 行 ) 也 定义 了 用 于 消息 内 容 〈 涉 及 
请 求 行 、 头 部 等 ) 的 协议 。 
协议 定义 了 应 该 如 何 格式 化 消息 ， 不 过 本 章 关注 的 是 如 何在 TCP 
流 中 分 隔 不 同 的 消息 。 


14.1. 使 用 新 行 


使 用 新 行 (newlines ) 的 确 是 一 种 划分 消息 的 简单 方法 。 如 果 你 确定 
应 用 程序 的 客户 端 和 服务 器 都 会 运行 在 同类 操作 系统 上 , 那 你 甚至 可 
以 在 套 接 字 上 退 而 使 用 I0#gets 和 I0#puts 发 送 带 新 行 的 消息 。 























让 我 们 来 重 写 CloudHash 服 务 器 的 相关 部 分 ,使 用 新 行 ( 而 非 EOF ) 
划分 消息 。 





def handle(connection) 
loop do 
request = connection.gets 
break if request -- 'exit' 
connection.puts process(request) 
end 
end 


对 服务 器 的 相关 改动 无 非 就 是 增加 了 1Loop， 把 read 改 成 了 gets。 这 样 
服务 器 就 能 够 处 理 客户 端的 所 有 请 求 ， 直 到 其 发 送 'exit' 请 求 为 止 。 








更 健壮 的 方法 是 使 用 I0.select， 在 连接 上 等 待 事件 发 生 。 如 果 客 户 
端 套 接 字 没有 发 送 'exit "请求 就 断 开 连接 ,我们 现 阶 段 的 服务 器 就 会 
Hist 
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而 客户 端 接 下 来 会 用 以 下 方式 送出 请 求 : 


def initialize(host, port) 
Gconnection = TCPSocket.new(host, port) 
end 


def get 
request "GET #{key}" 
end 


def set 
request "SET #{key} #{value}" 
end 


def request(string) 
Gconnection.puts(string) 


# 读 取 数据 ， 直 到 收 到 新 行 获取 答复 。 
@connection.gets 
end 


注意 , 客户 端 不 再 使 用 类 方法 。 现 在 连接 能 够 保持 多 个 请 求 ， 我们 可 
以 将 一 个 连接 封装 成 一 个 对 象 的 实例 ， 接 下 来 调用 该 对 象 的 方法 即 可 。 





新 行 与 操作 系统 
前 面 曾 讲 述 过 ,如 果 你 确定 客户 端 /服务 器 都 运行 在 同类 操作 系统 
上 ， 那 么 就 可 以 使 用 gets 和 puts。 我 来 解释 一 下 为 什么 。 


要 是 你 查看 gets 和 puts 的 文档 , 上 面 说 到 它 使 用 $/ 作 为 默认 的 行 
分 隔 符 。 该 变量 中 的 值 在 Unix 系 统 中 是 \n， 而 在 Windows 系 统 中 
则 是 \r\n。 所 以 如 果 在 一 个 系统 中 使 用 puts, 在 另 一 个 系统 中 使 
用 gets， 可 能 会 造成 不 兼容 。 如 果 你 想 使 用 这 个 方法 ， 那 么 要 确 
保 给 这 些 方 法 传递 一 个 明确 的 行 分 隔 符 作为 参数 ， 这 样 就 没有 兼 
容 性 的 问题 了 。 
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在 现实 中 使 用 新 行 划分 消息 的 协议 是 HITP。 下面 是 一 个 简短 的 HTTP 
请 求 : 





GET /index.html HTTP/1.1Nr^n 
Host: www.example.comNrNn 
Nr^n 


例子 中 使 用 转 义 序列 \r\n 明 确 地 标 出 了 新 行 。 任何 HTTP 客 户 端 /服务 
器 都 能 够 识别 这 些 新 行 ， 不 管 它们 运行 在 何 种 操作 系统 上 。 








这 个 方法 肯定 能 解决 问题 ， 但 并 非 唯一 的 解决 方法 。 
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另 一 种 划分 消息 的 方法 是 指定 内 容 长 度 (content length )。 











利用 这 种 方法 , 消息 发 送 方 先 计算 出 消息 的 长 度 , 使 用 pack 将 其 转换 
成 固定 宽度 的 整数 , 后 面 跟 上 消息 主体 一 并 发 送 。 消 息 的 接收 方 首先 
读 取 这 个 长 度 值 。 这样 就 能 知道 消息 的 大 小 。 然 后 接收 方 严格 读 取 长 
度 值 所 指定 的 字 节 数 ， 获 取 完 整 的 消息 。 














下 面 使 用 这 个 方法 来 修改 CLouLdHash 的 相关 部 分 : 


# 获得 一 个 随机 的 固定 宽度 整数 的 大 小 。 

SIZE. OF INT = [11].pack(C'i').size 

def handle(connection) 
# 用 pack 将 消息 长 度 转 换 成 固定 宽度 的 整数 。 对 它 进 行 read 及 Unpqack 操 作 。 
packed. msg. length = connection.read(SIZE. OF. INT) 
msg. length = packed. msg. length.unpack('i').first 


Ho 读 入 给 定 长 度 的 消息 。 
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request = connection.read(msg. length) 
connection.write process(request) 
end 


客户 端 可 以 像 下 面 这 样 发 送 请 求 : 


payload = 'SET prez obama' 


23 用 pack 将 消息 长 度 转换 成 国定 宽度 的 整数 。 
msg. length = payload.size 
packed. msg. length = [msg. length].pack(C'i') 


7H 写 入 消息 长 度 以 及 消息 主体 。 
connection.write(packed. msg. length) 
connection.write(payload) 





客户 端 用 pack 将 消 na a ig 的 
(native endian integer )。 这 一 点 dax 因为 它 保证 了 任何 给 定 
esce uas 。 如 果 不 是 这 样 ， minis 
究竟 应 该 读 取 多 少数 位 来 得 到 消 BN 用 了 这 个 方法 ， 客 户 端 / 
服务 器 在 通信 时 总 是 会 使 用 同样 数量 的 字 节 来 表示 消息 长 度 。 








这 次 涉及 的 代码 量 稍微 有 点 大 ,但 是 该 方法 没有 使 用 任何 像 gets 或 
puts 这 样 的 包装 方法 ， 只 是 使 用 了 read 和 write 这 类 基本 IO 操 作 。 
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P15% 

















超时 其 实 就 是 忍耐 。 你 愿意 在 套 接 字 连接 上 等 待 多 长 时 间 呢 ? 套 接 字 
ERNI ERTEAN 











所 有 这 些 的 答案 都 视 你 的 忍耐 力 而 定 。 高 性 能 网 络 程序 通常 都 不 愿意 
等 待 那些 没完 没 了 的 操作 。 如 果 你 的 套 接 字 没 能 在 5 秒 内 完成 数据 写 
A. 那 就 说 明 存 在 问题 ， 应 该 采取 其 他 的 操作 。 











15.1 不 可 用 的 选项 


如 果 你 花 时 间 研 读 过 Ruby 代 码 ， 可 能 看 到 过 timeout 库 ( 标准 库 的 一 
部 分 )。 尽 管 这 个 库 在 Ruby 中 通常 用 于 套 接 字 编程 ， 但 我 不 打算 在 这 
里 讨论 它 ， 因 为 有 更 好 的 超时 处 理 方式 。timeout 库 提供 了 一 种 通用 
的 超时 机 制 , 但 是 操作 系统 也 有 一 套 针 对 套 接 字 的 超时 机 制 , 效果 更 
好 日 更 直观 。 





























操作 系统 也 提供 了 自 带 的 套 接 字 超时 处 理 机 制 , 可 以 通过 套 接 字 选 项 
SNDTIMEO 和 RCVTIMEO 进 行 设置 。 不 过 自 Ruby 1.9 起 ， 这 个 特性 就 不 
能 再 用 了 。 由 于 Ruby 在 有 线程 存在 时 对 于 阻塞 式 IO 所 采用 的 处 理 方 
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法 ， 它 将 poll(C2) 相 关 的 所 有 套 接 字 操 作 进行 了 包装 ， 这 样 操作 系统 自 
各 的 套 接 字 超时 就 没有 什么 优势 了 。 所 以 这 些 这 类 超时 处 理 方式 也 没 
法 用 了 。 














那 还 剩 下 什么 能 用 呢 ? 


15.2 IO.select 





Wi, 还 是 召唤 我 们 的 “ 老 朋 友 ”I0.select 吧 。 它 的 用 途 可 真 够 多 的 。 





之 前 我 们 已 经 知道 如 何 使 用 I0.select 了 。 下 面 是 将 其 用 于 超时 的 
方法 : 


€ ./code/snippets/read timeout.rb 
require 'socket' 
require 'timeout' 


timeout = 5 # £v 
Socket.tcp. server. 10op(4481) do lconnectionl 


begin 
4 发 起 一 个 初始 化 reqd(2)。 这 一 点 很 重要 ， 
E 因为 要 求 套 接 字 上 有 被 请 求 的 数据 ， 有 数据 可 读 时 避免 使 用 select(2)。 
connection.read. nonblock(4096) 


rescue Errno: : EAGAIN 
E 监视 连接 是 否 可 读 
if IO.select([connection], nil, nil, timeout) 
# I0.select 会 将 套 接 字 返 回 ， 不 过 我 们 并 不 关心 返回 值 ， 
# 不 返回 il 就 意味 着 套 接 字 可 读 。 
retry 


else 
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raise Timeout::Error 
end 


end 


connection.close 
end 


我 在 这 里 使 用 timeout 只 是 为 了 访问 Timeout : : Errori 5 


15.3 ”接受 超时 


就 像 我 们 之 前 看 到 的 那样 , accept 能 同 I0.select 很 好 的 合作 。 如 果 
你 需要 对 qccept 设 置 超时 ， 做 法 同 read 一 样 。 


Server = 


TCPServer .new(4481) 
timeout = 5 # 秒 
begin 

server.accept. nonblock 


rescue Errno: : EAGAIN 


retry 


if IO.select([server], nil, nil, timeout) 
else 


raise Timeout::Error 
end 


end 


15.4 连接 超时 


对 连接 设置 超时 的 做 法 同 其 他 示例 差不多 。 





€ ./code/snippets/connect. timeout.rb 
require 'socket' 





84 %15% 超时 


require 'timeout' 


Socket = Socket.new(:INET, :STREAM) 
remote addr = Socket.pack sockaddr. in(80, 'google.com') 
timeout = 5 # 秒 


begin 
# 发 起 到 google.com 端 口 80 的 非 阻塞 式 连接 。 
Socket.connect. nonblock(remote. addr) 


rescue Errno: : EINPROGRESS 
X 表明 连接 过 程 正 在 进行 中 。 
# 我 们 监视 套 接 字 何 时 可 读 ， 这 意味 着 连接 已 经 完成 。 
# 一 旦 再 次 进入 上 面 的 代码 块 ， 就 会 转 入 EISCONN rescue 代 码 块 ， 
# 然后 运行 至 begin 代 码 块 外 ， 在 这 里 套 接 字 就 已 经 可 以 使 用 了 。 
if IO.select(nil, [socket], nil, timeout) 
retry 
else 
raise Timeout::Error 
end 


rescue Errno: : EISCONN 
E 表明 连接 已 经 顺利 完成 。 
end 


socket.write("ohai") 
Socket.close 





F 








这 些 基于 超时 的 I0.select 机 制 使 用 广泛 , 甚至 在 Ruby 的 标准 库 中 也 
能 看 到 ， 它 们 比 操作 系统 自 带 的 套 接 字 超时 处 理 机 制 的 稳定 性 











ra 
3 
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超时 可 以 让 你 很 好 地 控制 代码 , 但 是 有 些 地 方 就 没 法 那么 随心 所 欲 了 。 





看 一 下 这 个 客户 端 连接 的 例子 : 


# ./code/snippets/client. easy. way.rb 
require 'socket' 


socket = TCPSocket.new('google.com', 80) 


我 们 知道 Ruby 在 构造 函数 内 部 调用 了 connect。 因为 我 们 传人 的 是 主 
机 名 ， 而 非 卫 地址 ，Ruby 需 要 查询 DNS 将 主机 名 解析 成 可 以 连接 的 卫 
地 址 。 





害群之马 ? 一 个 缓慢 的 DNS 服务 器 会 阻塞 住 整个 Ruby 进 程 。 这 可 是 多 
线程 环境 最 糟糕 的 问题 了 


MRI 和 GIL 


标准 Ruby 实 现 (MRI ) 包含 了 一 个 全 局 解释 器 锁 ( Global Interpreter 





(D Matz's Ruby Interpreter. 译 者 注 
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Lock，GIL )。 它 确保 Ruby 解 释 器 一 次 只 做 一 件 有 潜在 危险 的 事 。 在 
多 线程 环境 中 , 它 才 能 真正 发 挥 作用 。 当 一 个 线程 进行 活动 时 ， 其 他 
线程 全 部 处 于 阻塞 状态 。 这 使 得 MRI 可 以 使 用 更 安全 、 更 简单 的 代码 
来 编写 。 


好 在 GIL 能 够 理解 阻塞 式 IO。 如 果 有 一 个 线程 在 进行 阻塞 式 IO〈 例如 
一 个 阻塞 式 read )，MRI 会 释放 GIL 并 让 另 一 个 线程 继续 执行 。 当 阻 
塞 式 IO 调 用 完成 后 ， 线 程 就 等 待 下 一 次 运行 。 

如 果 涉 及 C 语 言 扩 展 ，MRI 可 就 不 那么 大 方 了 。 只 要 代码 块 用 到 了 C 
语言 扩展 API，GIL 就 会 阻塞 其 他 代码 的 运行 。 阻 塞 式 IO 在 这 种 情况 
下 也 不 例外 ， 如 果 一 个 C 语 言 扩 展 阻塞 在 IO 操作 上 ， 所 有 其 他 线程 都 


目前 问题 的 关键 在 于 Ruby 使 用 了 一 个 C 语 言 扩展 查询 DNS， 所 以 如 果 
DNS 查询 长 时 间 阻 蹇 ，MRI 就 不 会 释放 GIL。 





















































resolv 


所 幸 的 是 Ruby 在 标准 中 提供 了 该 问题 的 解决 方法 。resolv 库 为 DNS 
查询 提供 了 一 套 纯 Ruby 的 替代 方案 。 这 使 得 MRI 能 够 为 长 期 阻塞 的 
DNS 查询 释放 GIL。 在 多 线程 环境 中 这 可 谓 是 一 大 优势 。 


resolv 库 有 自己 的 API, 不 过 标准 库 中 也 包含 了 一 个 库 , EX Socket 
进行 了 “猴子 修补 ”( monkey patch )， 使 它 也 可 以 使 用 resolv: 








require 'resolv' # £X 
require 'resolv-replace' # 猴子 修补 





(D http://en.wikipedia.org/wiki/Monkey. patch. 一 一 译 者 注 


图 灵 社 区 会 员 Tiny9458 专 享 尊重 版 权 





第 17 章 


SSL£HZ'T 








SSL 使 用 公 钥 加 密 提供 了 一 套用 于 在 套 接 字 上 进行 安全 的 数据 交换 
的 机 制 。 























el 而 是 将 不 安全 的 套 接 字 “升级 ” 
到 安全 的 SSL 套 接 字 。 如 果 你 愿意 ， 可 以 在 TCP 套 接 字 之 上 再 增添 一 
个 安全 层 。 




















要 注意 的 是 ， 一 个 套 接 字 可 以 升级 成 SSL， 但 是 一 个 套 接 字 不 能 同时 
进行 SSL 和 非 SSL 通 信 。 当 使 用 SSL 时 , 端 到 端的 通信 必须 全 部 都 使 用 
SSL 完 成 ， 否 则 无 法 保证 安全 。 





对 于 那些 既 需 要 在 SSL 上 又 需要 在 不 安全 的 TCP 上 运行 的 服务 ， 需 要 
使 用 两 个 端口 ( 两 个 套 接 字 )。HTTP 就 是 一 个 常见 的 例子 : 不 安全 的 
HTTP 默 认 使 用 端口 80， 而 HTTPS ( 运行 在 SSL 之 上 的 HTTP ) 通信 和 默 
认 是 在 端口 443 上 。 











所 有 TCP 套 接 字 都 可 以 转换 成 SSL 套 接 字 。 在 Ruby 中 这 通常 使 用 标准 
库 中 的 openss1 实 现 。 下 面 是 一 个 例子 : 
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X ./code/snippets/ssl. server.rb 
require 'socket' 
require 'openssl' 


def main 
# 建立 TCP 服 务 器 。 
server = TCPServer.new(4481) 


E 建立 SSL 环 境 。 

ctx = OpenSSL::SSL::SSLContext.new 

ctx.cert, ctx.key = create self signed cert( 
1024, 
LE'CN', 'localhost']], 
"Generated by Ruby/OpenSSL" 

) 

ctx.verify mode = OpenSSL: :SSL::VERIFY_PEER 


# 建立 TCP 服 务 器 的 SSL 包 装 器 。 
ssl server = OpenSSL::SSL::SSLServer.new(server, ctx) 


4 在 SSL 套 接 字 上 接受 连接 。 
connection = ssl_server.accept 


# 处 理 连接 。 
connection.write("Bah now") 
connection.close 

end 


E 接 下 来 的 代码 直接 取 自 Webrick/ssl， 
X 它 生成 一 个 适用 于 Context 对 象 使 用 的 自 签名 SSL 证 书 。 
def create self signed cert(bits, cn, comment) 
rsa = OpenSSL::PKey::RSA.new(bits)ilp, nl 
case p 
when 0; $stderr.putc "." # BW generate prime 
when 1; $stderr.putc "+" # BW generate prime 
when 2; $stderr.putc "*" # 搜索 good prime, 
# n = #of try, 
X 数据 同样 取 自 BN_generate_prime。 
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when 3; $stderr.putc "^n" £ 找到 good prime, n= - p, n==1 - q, 


X 数据 同样 取 自 BN_generate_prime 
else; $stderr.putc "*" # BN generate prime 
end 


cert = OpenSSL: :X509: :Certificate.new 
cert.version = 2 

cert.serial = 1 

name = OpenSSL: :X509: :Name.new(cn) 
cert.subject = name 

cert.issuer = name 

cert.not_before = Time.now 

cert.not_after = Time.now + (365*24*60*60) 
cert.public_key = rsa.public_key 


ef = OpenSSL: :X509: : ExtensionFactory.new(nil,cert) 


ef.issuer_certificate = cert 
cert.extensions = [ 


ef.create_extension("basicConstraints","CA:FALSE"), 
ef.create_extension("keyUsage", "keyEncipherment"), 


ef.create_extension("subjectKeyIdentifier", 


"hash"), 


ef.create. extension("extendedKeyUsage", "serverAuth"), 


ef.create extension("nsComment", comment), 


] 


aki = ef.create extension("authorityKeyIdentifier", 
"keyid:always,issuer:always") 


cert.add. extension(aki ) 
cert.sign(rsa, OpenSSL::Digest::SHA1.new) 


return [ cert, rsa ] 
end 


main 


这 段 代码 生成 一 个 自 签名 的 SSL 证 书 ， 用 它 来 支持 SSL 连 接 。 这 个 证 


书 是 SSL 安 全 性 的 关键 所 在 。 没 有 了 它 ， 连 接 的 安全 怡 
花 水 月 。 





图 灵 社 区 会 员 Tiny9458 专 享 尊重 版 权 








E 基 本 上 只 是 镜 
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同样 ， 出 于 安全 性 考虑 ， 还 应 该 设置 verify_mode = OpenSSL:: 
SSL::VERIFY PEER 。 很 Ruby 代码 库 默认 将 该 值 设 置 为 
OpenSSL: :SSL: :VERIFY_NONE。 这 是 一 个 比较 宽松 的 设置 ， 它 允许 
未 经 验证 的 SSL 证 书 ， 放 弃 了 很 多 由 证 书 提供 的 安全 性 。 该 问题 在 
Ruby 社 区 有 过 详尽 的 讨论 。” 











一 且 服 务 器 开始 运行 , 你 可 以 试 着 用 一 个 普通 的 TCP 连 接 , 配合 netcat 
进行 连接 : 


$ echo hello | nc localhost 4481 


Sc HI A e E zs HL JP" 4 EOpenSSL::SSL::SSLError. 7&4} 
好 事 ! 





服务 顺 拒 绝 接受 来 自 一 个 不 安全 的 客户 端的 连接 ， 然 后 产生 一 个 蜡 
常 。 重 启 服务 器 ， 使 用 配备 了 SSL 的 Ruby 客 户 端 再 次 连接 : 


€ ./code/snippets/ssl. client.rb 
require 'socket' 
require 'openssl' 


# 创建 TCP 客 户 端 套 接 字 。 
Socket = TCPSocket.new('0.0.0.0', 4481) 


Ssl socket = OpenSSL::SSL: :SSLSocket.new(socket) 
Ssl. socket.connect 


Ssl. socket.read 





(D http://www.rubyinside.com/how-to-cure-nethttps-risky-default-https-behavior-4010.html. 
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现在 你 应 该 可 以 看 到 服务 器 和 客户 端 都 顺利 退出 了 。 服务 器 与 客户 端 
之 间 完 成 了 一 次 成 功 的 SSL 通 信 。 


在 典型 的 产品 设置 中 ， 不 会 让 你 去 生成 自 签名 证 书 (这 只 适合 开发 / 
测试 )。 你 通常 要 从 一 个 可 信任 机 构 购 买 证 书 。 该 机 构 会 提供 给 你 用 
于 安全 通信 的 cert 和 key， 要 用 它们 代替 上 面 例子 中 的 自 签 名 证 书 。 
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之 前 我 强调 过 TCP 套 接 字 提供 了 一 种 有 序 的 数据 流 。 换 句 话 说 ,你 可 
以 将 TCP 数 据 流 想象 成 一 个 队列 。 套 接 字 连接 的 一 端 向 连接 中 写 和 人 数 
据 ， 就 相当 于 将 数据 入 列 。 这 些 数据 经 过 若干 个 阶段 (本 地 缓冲 、 网 
络 传 输 、 和 远程 缓冲 )， 然 后 在 接收 端的 套 接 字 处 出 列 。 























这 种 思考 模型 对 于 典型 的 TCP 通 信和 同样 适用 。TCP 紧 急 数 据 ， 更 多 的 
时 候 被 称 作 “ 带 外 数据 ”( out-of-band data )， 支 持 将 数据 推 到 队列 的 
前 端 ， 绕 过 其 他 已 在 传送 途中 的 数据 ， 以 便于 连接 的 另 一 端 尽 快 接收 
到 这 些 数 据 。 








Socket 还 有 一 个 我 们 没有 讲 过 的 方法 Socket#send。 


Socket#send 像 一 个 特殊 的 Socket#write (继承 自 I0 ), 实际 上 ,如 
果 不 带 参数 ， 它 的 行为 和 write 一 样 。 


4 





E 两 者 的 效果 相同 。 
Socket.write 'foo' 
Socket.send 'foo' 





write 方法 可 以 由 所 有 的 I0 对 象 使 用 ， 而 send 方 法 则 由 套 接 字 专用 。 
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这 使 得 Socket#send 可 以 接受 第 二 个 参数 : 标志 (flag) 我 们 可 以 为 
send 指 定 一 个 标志 ， 表 明 某 些 数 据 为 紧急 数据 。 


接 下 来 看 看 以 下 代码 : 


# ./code/snippets/sending_urgent_data.rb 
require 'socket' 


Socket = TCPSocket.new 'localhost', 4481 
4 使 用 标准 方法 发 送 数据 。 
Socket.write 'first' 


Socket.write 'second' 


E 发 送 紧急 数据 。 
Socket.send '!', Socket::MSG OOB 


要 发 送 1B 的 紧急 数据 ， 我 们 需要 调用 send 并 将 Socket: :MSG. OOB 7$ 
量 作 为 标志 。 这 里 的 00B 指 的 就 是 带 外 数据 。 





这 就 是 发 送 紧 急 数 据 的 方法 , 不 过 这 还 不 足以 使 接收 方 优 先 获取 到 紧 
急 数据 。 换 名 话说， 发 送 方 和 接收 方 需要 合作 才能 完成 这 项 工作 。 


18.2 接受 紧急 数据 
下 面 是 接收 方 使 用 Socket#recv 获 取 紧 急 数据 的 方法 : 


# ./code/snippets/receiving_urgent_data.rb 
require 'socket' 


Socket.tcp. server. 1oop(4481) do lconnectionl 
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# 优先 接收 紧急 数据 。 
urgent data = connection.recv(1, Socket::MSG_O0B) 


data = connection.readpartial(1024) 
end 


要 接收 紧急 数据 , 需要 使 用 Socket#recv 以 及 在 发 送 紧 急 数据 时 用 过 
的 那个 标志 。 同 Socket#send 一 样 ，Socket#revc 专 由 套 接 字 用 于 数 
据 读 取 。 它 同样 可 以 接受 标志 作为 参数 。 








即便 是 “普通 ”数据 先 于 紧急 数据 写 入 ， 也 可 以 在 “普通 ”数据 之 前 
使 用 紧急 数据 ,而 这 正 是 我 们 希望 达到 的 效果 。 要 注意 的 是 ， 必须 明 
确 地 接受 紧急 数据 。 如 果 不 调 用 recv ,服务 器 就 不 会 注意 到 紧急 数据 。 
也 就 是 说 ， 如 果 接 收 方 没有 去 查找 紧急 数据 ， 那 么 它 什么 都 得 不 到 。 
继续 往 下 看 如 何 处 理 这 种 情况 。 


如 果 不 存 在 未 处 理 的 紧急 数据 ， 调 用 connection.recv(1， 
Socket: :MSG_00B) 则 会 失败 ， 并 产生 Errno: : EINVAL, 


18.3 局 限 


你 大 概 已 经 注意 到 在 上 面 的 例子 中 我 只 发 送 了 一 个 字 节 的 紧急 数据 。 
这 是 有 意 而 为 的 。TCP 实 现 对 于 紧急 数据 仅 提 供 了 有 限 的 支持 , 一 次 
只 能 发 送 一 个 字 节 的 紧急 数据 。 如 果 你 要 发 送 多 个 字 节 , 那么 只 有 最 
后 一 个 字 节 会 被 视 为 紧急 数据 。 之 前 的 那些 数据 会 视 为 普通 的 TCP 数 
据 流 。 





图 灵 社 区 会 员 Tiny9458 专 享 尊重 版 权 








184 紧急 数据 和 IO.select | 95 


18.4 ”紧急 数据 和 I0. select 


和 大 多 数 情况 下 一 样 , 我 们 可 以 使 用 I0. select 监 视 多 个 套 接 字 上 的 
紧急 数据 。 不 过 该 方法 需要 特别 留意 。 





还 记 不 记得 我 说 过 I0.select 的 第 三 个 参数 是 一 个 IO 对 象 数据 ? 我 
们 需要 获取 这 些 IO 对 象 上 的 带 外 数据 。 下 面 是 具体 的 做 法 : 





# ./code/snippets/select_args.rb 
[<TCPSocket>, <TCPSocket>, <TCPSocket>] 
[<TCPSocket>, <TCPSocket>, <TCPSocket>] 


for_reading 
for_writing 


I0.select(for_reading, for writing, for. reading) 


有 没有 注意 到 这 里 传递 了 一 个 用 于 监视 读 取 的 套 接 字 数组 作为 第 三 
个 参数 ?这 意味 着 , 如 果 这 些 套 接 字 接收 到 了 紧急 数据 , 它们 会 被 包 
含 在 I0.select 所 返回 数组 的 第 三 个 元 素 中 。 


这 挺 不 错 , 这 样 我 们 就 可 以 监视 套 接 字 上 的 紧急 数据 , 而 不 用 再 盲目 
的 调用 recv 了 。 不 过 根据 我 的 经 验 , I0.select 会 不 停 地 报告 有 紧急 
数据 ,即便 是 所 有 的 紧 o 这 种 情况 会 持续 到 处 
理 完 一 些 普 通 的 TCP 数 据 流 , 很 可 能 直到 本 地 接收 缓冲 区 为 空 时 才能 
停止 。 这 意味 着 你 oue 误 处 理 或 是 状态 跟踪 ， 以 确保 
不 会 陷入 处 理 并 不 存在 的 紧急 数据 的 循环 。 

鉴于 这 方面 的 问题 以 及 单个 字 节 的 限制 , 紧急 数据 是 一 个 很 少 用 到 的 
TCP 特 性 。 在 Ruby 标 准 库 中 ， 它 只 用 到 了 一 次 (在 net/ftp 中 )， 而 
日 还 错误 地 试图 发 送 不 止 一 个 字 节 的 紧急 数据 。" 























(D http://www.ruby-forum.com/topic/201519. 
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18.5 SO. OOBINLINE 选项 





另 一 种 处 理 紧急 数据 的 方法 是 将 其 放 人 普通 数据 流 。 有 一 个 叫做 
S0_00BINLINE 的 套 接 字 选项 ,允许 在 带 内 接收 带 外 数据 。 也 就 是 说 ， 
紧急 数据 会 依照 次 序 被 合并 到 普通 数据 流 中 。 启 用 该 选项 后 ,紧急 数 
据 就 不 会 再 受到 优待 。 它 依据 写 人 次 序 从 队列 中 读 出 。 














下 面 是 启用 该 选项 的 方法 : 


X ./code/snippets/oob. inline.rb 
require 'socket' 


Socket.tcp. server. 100p(4481) do lconnectionl 
# 在 带 内 随同 其 他 普通 数据 接收 紧急 数据 。 
connection.setsockopt :SOCKET, :OOBINLINE, true 


E 注意 ， 当 遇 到 紧急 数据 时 停止 读 取 。 

connection.readpartial(1024) #=> 'foo' 

connection.readpartial(1024) #=> '!' 
end 


在 本 例 中 ， 数 据 foo 在 '!' 之 前 被 接收 ， 所 以 紧急 数据 不 再 会 被 优先 
接收 。 我 特意 演示 出 read 系 列 方法 处 理 紧 急 数 据 的 方式 。 尽 管 数据 
fooi’ 1 都 处 于 1024B 的 读 取 限制 中 ， 当 遇 到 紧急 数据 时 ， 它 会 停止 
读 取 ， 返 回 获 得 的 数据 ， 然 后 再 重新 开始 读 取 。 











选项 只 对 接收 方 套 接 字 有 效 ， 对 发 送 方 套 接 字 无 效 。 
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第 19 章 


网 络 染 构 模 式 





之 前 的 章节 涵盖 了 基础 知识 和 必 备 技能 , 接 下 来 的 部 分 将 转向 最 佳 实 
践 与 真实 案例 。 前 面 那些 章 类 似 参考 文档 : 你 可 以 向 前 翻阅 ， 回 顾 某 
些 特性 的 用 法 或 是 问题 的 解决 之 道 , 不 过 仅 限于 你 清楚 自己 想 要 查找 
的 具体 内 容 。 








如 果 你 的 任务 是 用 Ruby 编 写 一 个 FIP 服务器, 仅 了 解 本 书 的 前 半 部 分 
肯定 是 有 帮助 的 ， 但 这 些 知识 没 法 让 你 创造 出 伟大 的 软件 。 





尽管 你 了 解 建造 模块 ,但 是 你 还 不 知道 构架 网 络 应 用 程序 的 常见 方 
式 。 如 何 处 理 并 发 ? 如何 处 理 错误 ” 处 理 缓慢 的 客户 端的 最 好 方法 是 
什么 ?” 如何 最 有 效 地 利用 资源 ? 


这 类 问题 正 是 本 书后 面部 分 要 解答 的 。 接 下 来 我 们 先 学 习 6 种 网 络 架 
构 模 式 ， 然 后 将 它们 应 用 到 一 个 案例 项 目 中 。 


实现 思 





与 其 用 一 堆 图 表 和 抽象 的 描述 , 我 更 喜欢 的 说 明 问 题 的 方式 是 , 采用 


图 灵 社 区 会 员 Tiny9458 专 享 尊重 版 权 





98 | 第 19 章 ”网络 架构 模式 








一 个 能 够 实现 的 案例 项 目 并 用 不 同 的 架构 重复 实现 它 。 这 样 才能 真正 
理解 不 同 架构 之 间 的 差异 。 


出 于 这 个 原因 ， 我 们 要 编写 一 个 包含 了 部 分 FTP 功 能 的 服务 器 。 为 什 
么 只 包含 了 部 分 功能 ? 因为 我 希望 将 注意 力 放 在 架构 模式 , 而 非 协议 
实现 上 。 那 为 什么 选择 FTP? 因为 这 样 就 不 用 再 编写 单独 的 客户 端 就 
可 以 进行 测试 了 。 现 成 的 FTP 客 户 端 已 经 够 多 了 。 

对 于 那些 不 熟悉 FTP 的 读者 ，FTP 代 表 文 件 传 输 协议 〈File Transfer 
Protocol )。 它 定义 了 一 套 基 于 文本 的 协议 ,通常 运行 在 TCP 之 上 ,用 
于 在 两 台 计算 机 之 间 传 送 文件 。 





如 你 所 见 ， 这 有 点 像 是 在 浏览 文件 系统 。FTP 同 时 使 用 了 两 个 TCP 套 
接 字 。 一 个 是 控制 套 接 字 ， 用 于 在 服务 器 和 客户 端 之 间 发 送 FTP 命 
令 及 参数 。 每 当 传送 文件 时 ， 就 会 使 用 一 个 新 的 TCP 套 接 字 。 这 是 
个 不 错 的 技巧 ， 它 使 得 在 传送 文件 的 同时 仍 可 以 在 控制 套 接 字 上 处 


理 命令 。 





























下 面 是 FTP 服 务 器 的 协议 实现 。 它 定义 了 一 些 常 用 的 方法 ， 用 于 写 人 
格式 化 的 FTP 响 应 以 及 建立 控制 套 接 字 ， 它 还 提供 了 一 个 
CommandHandler 类 ， 封 装 了 基于 每 个 连接 的 单独 命令 的 处 理 。 这 一 
点 很 重要 。 同 一 服务 器 上 的 每 个 连接 可 能 有 不 同 的 工作 目录 ， 
CommandHandler 类 也 考虑 到 了 这 一 点 。 

















€ ./code/ftp/common. handler.rb 
module FTP 
class CommandHandler 
CRLF = "NrNn" 


attr_reader :connection 
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def initialize(Cconnection) 
Gconnection = connection 
end 


def pwd 
Gpwd || Dir.pwd 
end 


def handle(data) 
cmd = data[0..3].strip.upcase 
options - data[4..-1].strip 


case cmd 
when 'USER' 
# 接受 匿名 用 户 
"230 Logged in anonymously" 


when 'SYST' 
HH 
"215 UNIX Working With FTP" 


when 'CWD' 
if File.directory?(Coptions) 
Gpwd = options 
"250 directory changed to #{pwd}" 
else 
"550 directory not found" 
end 


when 'PWD' 
"257 \"#{pwd}\" is the current directory" 


when 'PORT' 
parts = options.split(',') 
ip address = parts[0..3].join('.') 
port = Integer(parts[4]) * 256 + Integer(parts[5]) 


edata. socket = TCPSocket.new(ip. address, port) 
"200 Active connection established (#{port})" 
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when 'RETR' 
file = File.open(File.join(pwd, options), 'r') 
connection.respond "125 Data transfer starting 


#{file.size} bytes" 


bytes = IO.copy stream(file, Gdata. socket) 
edata. socket.close 


"226 Closing data connection, sent #{bytes} bytes" 


when 'LIST' 
connection.respond "125 Opening data connection 


for file list" 


result = Dir.entries(pwd). join(CRLF) 
edata. socket .write(result) 
edata. socket.close 


" 


"226 Closing data connection, sent Z[result.size] bytes 


when 'QUIT' 
"221 Ciao" 
else 
"502 Don't know how to respond to #{cmd}" 
end 
end 
end 
end 
这 个 协议 的 实现 并 没有 过 多 关注 网 络 和 并 发 , 这 部 分 内 容 将 在 下 一 章 
介绍 。 
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我 们 要 学 习 的 第 一 个 网 络 架 构 模 式 是 处 理 请 求 的 串 行 化 模型 。 我 们 接 
着 之 前 FTP 服务 器 继续 讲解 。 


20.1 讲解 


在 串 行 化 架构 中 , 所 有 的 客户 端 连接 是 依次 进行 处 理 的 。 因 为 不 涉及 
并 发 ， 多 个 客户 端 不 会 同时 接受 服务 。 


串 行 化 架构 的 处 理 流 程 很 直观 : 

(1) 客户 端 连接 ; 

(2) 客户 端 /服务 器 交换 请 求 及 响应 ; 
(3) 客户 端 断 开 连 接 ; 

(4) 返回 到 步骤 (1)。 


20.2 ”实现 


# ./code/ftp/arch/serial.rb 
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require 'socket' 
require relative '../command. handler' 


module FTP 
CRLF = "Nr^n" 


class Serial 
def initialize(port - 21) 
Gcontrol socket = TCPServer.new(port) 
trapC:INT) { exit } 
end 


def gets 
Gclient.gets(CRLF) 
end 


def respond(message) 
Gclient.write(message) 
Gclient.writeCCRLF) 
end 


def run 
loop do 
Gclient = Gcontrol socket.accept 
respond "220 OHAI" 


handler = CommandHandler.new(self) 


loop do 
request = gets 


if request 
respond handler.handle(request) 
else 
Gclient.close 
break 
end 
end 
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end 
end 
end 
end 


server = FTP::Serial.new(4481) 
server.run 





注意 ，Serial 类 只 负责 联网 和 并 发 操作 ， 协 议 处 理 部 分 交 由 Comm- 
andHandle 的 方法 来 处 理 。 接 下 来 你 会 经 常 看 到 这 种 模式 。 让 我 们 来 
从 头 看 起 。 


X ./code/ftp/arch/serial.rb 
class Serial 


def initialize(port - 21) 
Gcontrol socket = TCPServer.new(port) 
trapC:INT) { exit } 

end 


def gets 
Gclient.gets(CRLF) 
end 


def respond(message) 
Gclient.write(message) 
Gclient.writeCCRLF) 
end 





这 3 个 方法 属于 这 类 特定 实现 的 样板 代码 ( boilerplate ), initialize 
方法 打开 一 个 套 接 字 ， 由 该 套 接 字 接 受 客户 端 连接 。 




















gets 方法 将 gets 委托 给 当前 客户 端 连 接 。 注意 , 它 传递 了 一 个 明确 
的 分 隔 符 ， 用 以 保证 在 具有 不 同 默认 分 隔 符 的 平台 之 间 的 可 移 
植 性 。 
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respond 方法 用 来 写 人 格式 化 过 的 FTP Mo message 中 包含 了 整 
数 类 型 的 响应 代码 以 及 对 应 的 字符 串 消 息 。 当 客户 端 接收 到 回 车 符 Nr 
和 换行 符 \n 组 合 时 ， 它 就 知道 已 经 获得 了 完整 的 响应 信息 。 











X ./code/ftp/arch/serial.rb 
def run 
loop do 
Gclient = Gcontrol socket.accept 
respond "220 OHAI" 


handler = CommandHandler.new(self) 





这 是 服务 顺 的 主 循环 ， 所 有 的 处 理 逻 辑 都 发 生 在 外 部 主 循环 之 内 。 


循环 中 唯一 一 次 调用 accept 就 是 你 在 这 儿 看 到 的 这 次 。 它 接受 一 个 
来 自 @control_socket 的 连接 , 后 者 在 initialize 中 进行 初始 化 。 
代码 为 220 的 响应 内 容 属 于 协议 实现 细节 。FTP 要 求 在 接受 一 个 新 的 
客户 端 连 接 之 后 要 打 声 招呼 " 。 




















最 后 一 处 是 为 该 连接 进行 ComnandHandler 的 初始 化 。 该 类 封装 了 服 
务 器 上 每 个 连接 的 当前 状态 〈 当前 工作 目录 )。 我 们 可 以 将 接 和 人 的 请 
求 交 给 handler 对 象 ， 然 后 获得 对 应 的 响应 。 


这 部 分 代码 是 串 行 化 模式 中 进行 并 发 操作 的 绊脚石 。 在 这 部 分 代码 进 
行 处 理 时 ， 服务 器 没 法 继续 接受 新 的 连接 ,更 不 用 说 实现 并 发 了 。 当 
我 们 学 到 其 他 模式 如 何 应 对 这 种 情况 时 ,就 会 明显 看 出 它们 之 间 的 差 
Ti 

















Q@ 回复 代码 220 (reply code 220) 表 示 Service ready for new user， 详 见 RFC959, 
一 一 译 者 注 
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X ./code/ftp/arch/serial.rb 
loop do 
request - gets 


if request 
respond handler.handle(request) 
else 
Gclient.close 
break 
end 
end 


这 部 分 完成 了 我 们 的 FTP 服务 器 的 串 行 化 实现 。 





在 内 部 循环 中 ,使 用 gets 从 客户 端 套 接 字 中 获取 人 带 有 显 式 分 隔 符 的 
请 求 。 然 后 将 获得 的 请 求 传 给 handler, 由 它 为 客户 端 构造 对 应 的 响 
应 信息 。 











鉴于 这 是 一 个 功能 完善 的 FTP 服务 器 〈 尽 管 只 支持 部 分 FTP 功能 ), 
我 们 实际 上 可 以 运行 该 服务 器 , 使 用 标准 的 FTP 客户 端 进行 连接 , 看 
看 它 的 实际 表现 : 


$ ruby code/ftp/arch/serial.rb 


$ ftp -a -v 127.0.0.1 4481 
cd /var/log 

pwd 

get kernel.log 


20.3 思考 


很 难 明确 地 归纳 每 种 模式 的 优 劣 ， 因为 这 完全 取决 于 你 的 需求 。 我 会 
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尽力 解释 每 种 模式 最 适用 的 场景 及 其 所 作出 的 一 些 权衡 。 


串 行 化 架构 最 大 的 优势 在 于 它 的 简单 性 。 没 有 锁 , 没有 共享 状态 ,处 
理 完 一 个 连接 之 后 才能 处 理 男 一 个 。 在 资源 使 用 方面 亦 是 如 此 : 一 个 
实例 处 理 一 个 连接 ， 一 个 更 卜 一 个 坑 ， 绝 不 多 消耗 资源 。 





串 行 化 架构 明显 的 劣势 是 不 能 并 发 操作 。 即 便 是 当前 连接 处 于 空闲 ， 
也 不 能 处 理 等 待 的 连接 。 同 样 ， 如 果 某 个 连接 使 用 的 链 路 速度 不 佳 ， 
或 者 在 发 送 请 求 之 间 和 暂停 ， 那 么 服务 器 就 只 能 保持 阻塞 ， 直 到 连接 
关闭 。 





对 于 随后 那些 更 有 意思 的 模式 而 言 ， 串 行 化 模式 仅仅 是 一 个 起 点 
而 已 。 
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这 是 首 个 可 以 对 请 求 进 行 并 行 处 理 的 网 络 架 构 。 


21 


.1 


讲解 


要 支持 并 发 处 理 ,， 只 需要 将 串 行 化 架构 略 加 修改 即 可 。 接 受 连 接 的 代 
码 不 需要 改动 ， 处 理 来 自 套 接 字 数据 的 代码 也 保持 不 变 。 





相关 改动 出 现在 接受 连接 之 后 , 服务 融会 fork 出 一 个 子 进 程 , 这 个 子 

















进程 


EF 





全 一 目的 就 是 处 理 新 连接 。 连 接 处 理 完 毕 之 后 就 退出 。 














进程 衍生 的 基础 知识 


只 要 你 使 用 $ruby myapp.rb 启 动 程序 ， 就 会 生成 一 个 新 的 Ruby 
进程 来 载 入 并 执行 代码 。 


如 果 在 程序 中 使 用 了 fork， 那 实际 上 就 是 在 运行 期 间 创 建 了 一 个 
新 进程 。fork 可 以 使 你 获得 两 个 一 模 一 样 的 进程 。 新 创建 的 进程 
被 视 为 “孩子 ”; 原先 的 进程 被 视 为 “双亲 ”。 一 旦 fork 完 成 ,就 
拥有 了 两 个 进程 ， 它 们 可 以 各 行 其 道 ， 各 行 其 事 。 
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d uM 这 意味 着 我 们 可 以 qccept 一 个 连接 , fork 一 个 
子 进程 ， 这 个 子 进程 会 自动 获得 一 份 客户 端 连 接 的 副本 。 无 需 其 
他 的 设置 、 数 据 共享 或 者 锁 ， 直 接 就 可 以 开始 并 行 处 理 了 。 





让 我 们 来 理 清 楚 事件 流程 : 
(1) 一 个 连接 抵达 服务 器 ; 

(2) 主 服务 咒 进 程 接受 该 连接 ; 

(3) 衍生 出 一 个 和 服务 带 一 模 一 样 的 新 子 进程 ; 

















(4) 服务 器 进程 返回 步骤 1， 由 子 进程 并 行 处 理 连 接 。 











得 益 于 内 核 语义 ,这些 进程 是 并 行 执 行 的 。 子 进程 处 理 连接 时 ,原先 
的 父 进程 可 以 继续 接受 新 连接 ， 衍 生出 新 的 子 进 程 对 其 进行 处 理 。 




















不 管 何 时 ,总 是 有 一 个 父 进程 等 着 接受 连接 , 但 可 能 会 有 多 个 子 进程 





X ./code/ftp/arch/process. per. connection.rb 
require 'socket' 
require. relative '../command. handler' 


module FTP 
class ProcessPerConnection 


CRLF = "NrNn" 


def initialize(port - 21) 
Gcontrol socket = TCPServer.new(port) 
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trapC:INT) { exit } 
end 


def gets 
Gclient.gets(CRLF) 
end 


def respond(message) 
Gclient.write(message) 
Gclient.writeCCRLF) 
end 


def run 
loop do 
Gclient = Gcontrol. socket.accept 


pid = fork do 
respond "220 OHAI" 


handler = CommandHandler.new(self) 


loop do 
request - gets 


if request 
respond handler.handle(request) 

else 
Gclient.close 
break 

end 

end 
end 


Process.detach(pid) 
end 
end 
end 
end 
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server = FTP::ProcessPerConnection.new(4481) 
server.run 


如 你 所 见 , 大 部 分 代码 都 没有 变动 。 最 大 的 不 同 在 于 内 循环 被 放 在 了 
一 个 fork 调 用 中 。 


X ./code/ftp/arch/process. per. connection.rb 
Gclient = Gcontrol. socket.accept 


pid = fork do 
respond "220 OHAI" 


handler = CommandHandler.new(self) 


使 用 accept 接 受 连 接 后 ， 服 务 器 进程 立刻 就 使 用 代码 块 调用 fork。 
新 的 子 进程 会 对 该 代码 块 进 行 求 值 ， 然 后 退出 。 














这 意味 着 每 一 个 接 入 的 连接 都 由 一 个 独立 的 进程 进行 处 理 。 父 进程 不 
会 对 代码 块 求 值 。 它 只 会 沿 着 自己 的 执行 路 径 进 行 。 


# /code/ftp/arch/process. per. connection.rb 
Process.detach(pid) 


注意 ， 我 们 在 最 后 调用 了 Process .detach。 在 一 个 进程 退出 之 后 ， 
它 并 不 会 被 完全 清除 ， 直到 其 父 进程 查询 该 进程 的 退出 状态 。 在 这 里 
我 们 并 不 关心 子 进程 的 退出 状态 是 什么 ， 所 以 提前 把 它 与 父 进程 分 
离 ， 确 保 子 进程 退出 后 ， 所 占用 的 资源 能 够 完全 清除 。” 








i 
































QD 如 果 你 希望 学 习 更 多 有 关 进 程 生成 及 僵尸 进程 的 知识 ， 可 以 参考 我 翻译 的 另 一 本 
书 《 理 解 Unix 进 程 》( Working with Unix Processes )。 
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21.3 思考 


该 模式 有 诸多 优势 。 首 先是 它 的 简单 性 。 为 了 能 够 并 行 处 理 多 个 客户 
端 ， 只 需要 在 串 行 化 实现 的 基础 上 增加 极 少量 的 代码 即 可 。 





第 二 个 优势 是 这 种 并 行 操作 不 难 理解 。 之 前 我 说 过 , fork 实 际 上 提供 
了 一 个 子 进 程 所 需要 的 所 有 东西 的 副本 。 不 用 留心 边界 情况 ( edge 
cases )， 没 有 锁 或 竞争 条 件 ， 只 是 简单 的 分 离 而 已 。 


一 个 明显 的 劣势 是 , 对 于 fork 出 的 子 进程 的 数量 没有 施加 上 限 。 如 果 
客户 端 数量 不 大 ， 这 倒 也 不 是 什么 问题 ， 但 如 果 生 成 了 上 百 个 进程 ， 
那 你 的 系统 就 可 能 会 朋 溃 了 。 这 方面 可 以 使 用 第 23 章 介绍 的 
Preforking 模 式 解决 。 





取决 于 操作 环境 ,使 用 fork 可 能 会 有 问题 。 只 有 Unix 系 统 才 支持 
fork。 这 就 意味 着 在 Windows 或 JRuby 中 就 没 法 用 fork 了 。 


男 一 个 方面 是 究 况 该 用 进程 还 是 线程 ,我 把 这 个 问题 留 到 下 一 章 来 讨 
论 ， 届 时 我 们 会 接触 到 线程 。 


21.4 案例 


D shotgun 
DQ inetd 
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22.1 讲解 


单 连接 线程 模式 和 上 一 章 的 单 连接 进程 模式 非常 相似 。 不 同 之 处 在 
于 ， 它 是 生成 线程 ， 而 非 进 程 。 











线程 与 进程 
线程 和 进程 都 可 以 用 于 并 行 操作 ， 但 是 方式 大 不 相同 。 没 有 万 能 
药 ， 完 竟 用 哪个 取决 于 实际 情况 。 


生成 (spawn )。 就 生成 而 言 ， 线 程 的 生成 成 本 要 低 得 多 。 生 成 一 
个 进程 需要 创建 原始 进程 所 拥有 的 一 切 资源 的 副本 。 线 程 以 进程 
为 单位 ， 多 个 线程 都 存在 于 同一 个 进程 中 。 由 于 多 个 线程 共享 内 
存 ， 无 需 创 建 副本 ， 因 而 线程 的 生成 速度 要 快 得 多 。 


同步 。 因 为 线程 共享 内 存 ， 当 使 用 会 被 多 个 线程 访问 的 数据 结构 
时 ， 一定 要 多 加 小 心 。 这 通常 意味 着 要 在 线程 之 间 使 用 互 斥 量 
( mutex )、 锁 和 同步 访问 。 进程 就 无 须 如 此 了 ， 因 为 每 个 进程 都 有 
自己 的 一 份 资源 副本 。 
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并 行 。 两 者 都 提供 了 由 内 核实 现 的 并 行 计 算 功能 。 关 于 MRI 中 的 
线程 并 行 需要 注意 的 一 件 重要 的 事情 是 : 解释 器 对 当前 执行 环境 
使 用 了 一 个 全 局 锁 。 因 为 线程 以 进程 为 单位 ， 这 意味 着 它们 都 运 
行 在 同一 个 解释 器 中 。 即 便 是 使 用 了 多 线程 ，MRI 也 使 得 它们 无 
法 实现 真正 的 并 行 。 在 另外 一 些 Ruby 实 现 中 ， 如 JRuby 或 Rubinius 
2.0， 不 存在 这 样 的 问题 。 


进程 没有 这 方面 的 麻烦 ， 因 为 每 次 生成 新 的 进程 ， 它 都 会 获得 自 
己 的 一 份 Ruby 解 释 器 的 副本 ， 所 以 也 就 无 需 全 局 锁 。 在 MRI 中 ， 
只 有 进程 才能 实现 真正 的 并 发 。 


关于 并 行 和 线程 还 要 多 说 一 点 。 即便 是 MRI 使 用 了 全 局 解释 器 锁 ， 
它 对 线程 的 处 理 也 非常 巧妙 。 第 16 章 我 提 到 过 ， 如 果菜 个 线程 阻 
塞 在 IO 上 ，Ruby 能 让 其 他 的 线程 继续 执行 。 


总 而 言 之 ， 线 程 是 轻 量 级 的 ， 进 程 是 重量 级 的 。 两 者 都 用 于 并 行 
操作 。 两 者 都 有 各 自 的 适用 环境 。 


22.2 ”实现 


€ ./code/ftp/arch/thread. per. connection.rb 
require 'socket' 
require 'thread' 
require. relative 


' ,.. / command. handler" 
module FTP 
Connection = Struct.new(:client) do 
CRLF = "\r\n" 


def gets 


client.gets(CRLF) 
end 
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def respond(message) 
client.write(message) 
client.writeCCRLF) 
end 


def close 
client.close 
end 
end 


class ThreadPerConnection 
def initialize(port - 21) 
Gcontrol socket = TCPServer.new(port) 
trapC:INT) { exit } 
end 


def run 
Thread.abort on. exception = true 


loop do 
conn = Connection.new(Gcontrol. socket.accept) 


Thread.new do 
conn.respond "220 OHAI" 


handler = FTP::CommandHandler.new(conn) 


loop do 
request - Gconn.gets 


if request 
conn.respond handler.handle(request) 
else 
conn.close 
break 
end 
end 
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end 
end 
end 
end 
end 


server = FTP::ThreadPerConnection.new(4481) 
server.run 


这 段 代码 同 之 前 的 两 个 例子 略微 有 些 不 同 。 使 用 的 方法 基本 一 样 , 但 
是 组 织 形 式 却 截然 不 同 。 


X ./code/ftp/arch/thread. per. connection.rb 
Connection = Struct.new(:client) do 
CRLF = "NrNn" 


def gets 
client.gets(CCRLF) 
end 


def respond(message) 
client.write(message) 
Cclient.writeCCRLF) 
end 


def close 
client.close 
end 
end 


此 处 的 样板 代码 和 之 前 看 到 的 一 样 ， 但 是 如 今 被 放 入 了 Connection 
类 中 ， 而 不 是 直接 定义 在 服务 器 类 中 。 





# ./code/ftp/arch/thread. per. connection.rb 
def run 
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Thread.abort_on_exception = true 


loop do 
conn = Connection.new(@control_socket.accept) 


Thread.new do 
conn.respond "220 OHAI" 


handler = FTP::CommandHandler.new(conn) 





这 里 有 两 处 关键 的 不 同 。 首先 是 这 部 分 代码 生成 了 一 个 线程 ,而 在 上 
个 例子 的 这 个 地 方 生成 的 是 一 个 进程 。 其 次 是 从 accept 返 回 的 客户 
端 套 接 字 被 传 给 了 Connection.new; 每 个 线程 均 获得 自己 的 
Connection 实 例 。 











使 用 线程 时 , 这 一 点 非常 重要 。 如 果 我 们 就 像 以 前 那样 ,只 是 简单 地 
将 客户 端 套 接 字 分 配给 一 个 实例 变量 , 那么 它 会 在 所 有 的 活动 线程 之 
间 共 享 。 因 为 这 些 线程 是 从 一 个 共享 的 FTP 服 务 顺 实例 中 生成 的 ， 所 
以 它们 会 共享 该 实例 的 内 部 状态 。 








这 与 同 进程 打交道 有 着 显著 的 差别 , 在 后 者 中 每 个 进程 都 会 获得 内 存 
中 所 有 资源 的 副本 。 之 所 以 有 些 开 发 者 声称 线程 编程 不 容易 ， 其 中 一 
个 原因 便 是 状态 共享 。 如 果 你 使 用 线程 进行 套 接 字 编程 ,有 一 条 简单 
的 经 验 : 让 每 个 线程 获得 它 自己 的 连接 对 象 。 这 可 以 让 你 少 些 有 麻烦。 


























22.3 RUE 


该 模式 和 前 一 个 模式 有 很 多 共同 的 优势 : 代码 修改 量 很 少 , 很 容易 理 
解 。 尽 管 使 用 线程 会 引入 锁 以 及 同步 问题 , 但 这 里 我 们 并 不 用 担心 这 
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个 问题 ， 因 为 每 个 连接 是 由 单个 独立 线程 来 处 理 的 。 


该 模式 较 单 连接 进程 的 一 个 优势 是 线程 占用 资源 少 , 因而 可 以 获得 数 
量 上 的 增加 。 比 起 使 用 进程 ， 它 能 为 客户 端 服务 提供 更 好 的 并 发 性 。 





不 过 先 等 等 , 别 忘 了 MRI GIL 使 得 这 一 优势 无 法 变 成 现实 。 归 根 结 底 ， 
没有 哪个 模式 能 够 所 向 披 靡 。 每 一 种 都 应 该 思考 、 答 试 、 检 验 。 


这 个 模式 和 单 连接 进程 模式 有 一 个 共同 的 劣势 : 线程 数 会 不 断 增加 ， 
直到 系统 不 堪 重 负 。 如 果 你 的 服务 器 要 处 理 持续 增加 的 连接 ,系统 可 
能 难以 在 所 有 的 活动 线程 上 进行 维护 及 切换 。 这 可 以 通过 限制 活动 线 
程 数 解决 。 在 第 24 章 我 们 会 讲解 这 种 做 法 。 





22.4 ”案例 


口 WEBrick 





D Mongrel 
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Preforking 
23.1 讲解 


Preforking 模 式 又 折 回 到 之 前 的 单 连接 进程 架构 上 了 。 





它 依赖 进程 作为 并 行 操作 的 手段 , 但 并 不 为 每 个 接 和 的 连接 衍生 对 应 
的 子 进程 , 而 是 在 服务 右 启 动 后 ,连接 到 达 之 前 就 先 衍生 出 一 批 进 程 。 


下 面 是 人 处理 流程 : 
(1) 主 服务 右 进 程 创建 一 个 侦 听 套 接 字 ; 
Q) 主 服务 右 进 程 衍生 出 一 大 批 子 进程 ; 























(3) 每 个 子 进程 在 共享 套 接 字 上 接受 连接 ， 然 后 进行 独立 处 理 ; 


(4) 主 服务 器 进程 随时 关注 子 进程 。 








这 个 流程 的 重点 是 , 主 服务 器 进程 打开 侦 听 套 接 字 , 却 并 不 接受 该 套 
接 字 之 上 的 连接 。 它 然后 衍生 出 预定 义 数量 的 一 批 子 进程 ,每 个 子 进 
程 都 有 一 份 侦 听 套 接 字 的 副本 。 子 进程 在 各 自 的 侦 听 套 接 字 上 调用 
accept， 不 再 考虑 父 进程 。 
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这 个 模式 的 精妙 之 处 在 于 ， 无 须 担 心 负载 均衡 或 是 子 进程 连接 的 同 
步 , 因为 内 核 已 经 蔡 我 们 完成 这 个 工作 了 。 对 于 多 个 进程 试图 在 同一 
个 套 接 字 的 不 同 副 本 上 接受 (accept) 连接 的 问题 ， 内 核 会 均衡 负 
载 并 确保 只 有 一 个 套 接 字 副本 可 以 接受 某 个 特定 的 连接 。 














23.2 ”实现 








# ./code/ftp/arch/preforking.rb 


require 'socket' 
require. relative '../command. handler' 


module FTP 
class Preforking 
CRLF = "Nr^n" 
CONCURRENCY = 4 


def initialize(port - 21) 
Gcontrol socket = TCPServer.new(port) 
trapC:INT) { exit } 

end 


def gets 
Gclient.gets(CRLF) 
end 


def respond(message) 
Gclient.write(message) 
Gclient.writeCCRLF) 
end 


def run 
child. pids = [] 


CONCURRENCY.times do 
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child pids << spawn. child 
end 


trapC:INT) { 
child. pids.each do lcpidl 
begin 
Process.killC:INT, cpid) 
rescue Errno: :ESRCH 
end 
end 


loop do 
pid = Process.wait 
$stderr.puts "Process #{pid} quit unexpectedly" 


child. pids.delete(pid) 
child pids «« spawn child 
end 
end 


def spawn. child 
fork do 
loop do 
Gclient = Gcontrol. socket.accept 
respond "220 OHAI" 


handler = CommandHandler.new(self) 


loop do 
request - gets 


if request 

respond handler.handle(request) 
else 

Gclient.close 
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break 
end 
end 
end 
end 
end 
end 
end 


server = FTP::Preforking.new(4481) 
server.run 


这 个 实现 同 我 们 迄今 所 看 过 的 有 明显 不 同 。 我 们 分 两 部 分 进行 讨论 ， 
先 从 上 半 部 分 开始 。 


4 ./code/ftp/arch/preforking.rb 
def run 
child. pids = [] 


CONCURRENCY.times do 
child pids << spawn. child 
end 


trapC:INT) { 
child. pids.each do lcpidl 
begin 
Process.killC:INT, cpid) 
rescue Errno: :ESRCH 
end 
end 


loop do 
pid = Process.wait 
$stderr.puts "Process #{pid} quit unexpectedly" 
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child. pids.delete(pid) 
child pids << spawn. child 
end 
end 


首先 多 次 调用 spawn_chi1d, 具体 次 数 基 于 存储 在 CONCURRENCY 中 的 
值 而 定 。spawn_child 方 法 ( 随后 会 详细 讲解 ) 会 fork 一 个 新 进程 然 
后 返回 其 进程 id ( pid )， 该 值 是 唯一 的 。 











生成 子 进程 后 ， 父 进程 为 INT 信 号 定义 了 一 个 信号 处 理 顺 。 当 你 键 和 人 
CtrL-C 时 ， 进 程 就 会 收 到 该 信号 。 这 个 信号 处 理 器 仅 用 于 将 父 进 程 
接收 到 的 INT 信 和 号 转发 给 它 的 子 进程 。 记 住 ， 子 进程 独立 于 父 ied 
存在 ， 即 便 是 父 进程 结束 了 , 子 进程 也 不 会 受到 影响 。 所 以 对 于 父 

程 而 言 ， 在 退出 之 前 清理 自己 的 子 进程 就 显得 很 重要 了 。 

















证 号 处 理 完 之 后 ， 父 进程 就 进入 了 Process .wait 循 环 。 该 方法 会 一 
直 阻 塞 到 有 子 进 程 退出 为 止 。 它 返回 退 inn 因为 子 进程 
并 不 应 该 退出 ， 所 以 我 们 将 这 视 为 出 现 了 异常 情况 。 随 后 在 STDERR 
上 打印 一 条 信息 并 生成 一 个 新 的 子 进程 代 蔡 。 








4 




















在 一 些 Preforking 服 务 器 中 , 尤其 是 Unicorn”， 1 
的 角色 , 它 还 负责 监视 自己 的 子 进程 。 例 如 ， 父 进程 可 能 会 查看 是 

有 哪个 子 进程 耗费 了 太 多 的 时 间 处 理 请 求 。 父 进程 a 
终止 该 子 进程 并 生成 新 的 子 进程 取代 它 。 


























(D http://unicorn.bogomips.org. 
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# ./code/ftp/arch/preforking.rb 
def spawn. child 
fork do 
loop do 
Gclient = Gcontrol. socket.accept 
respond "220 OHAI" 


handler = CommandHandler.new(self) 


loop do 
request = gets 


if request 
respond handler.handle(request) 

else 
Gclient.close 
break 

end 

end 
end 
end 
end 


这 种 方法 的 核心 部 分 应 该 很 熟悉 了 。 这 次 它 被 放 人 了 fork 和 1oop 中 。 
因此 新 进程 在 调用 accept 之 前 就 已 ua 最 外 层 的 循环 确 
保 每 个 连接 处 理 并 关闭 后 ， 继 续 处 理 新 的 连接 。 通 过 这 种 方法 ， 每 个 
子 进程 都 处 于 它们 各 自 的 连接 接受 循环 中 。 

















23.3 思考 


这 个 巧妙 的 模式 得 益 于 以 下 几 处 设计 。 





相 较 于 类 似 的 单 连接 进程 架构 ，Preforking 不 用 在 每 个 连接 期 间 进 行 
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fork, 进程 衍生 的 成 本 可 不 少 , 在 单 连 接 进程 架构 中 , 每 个 连接 都 要 
承担 由 此 带 来 的 开销 。 





如 前 所 述 , 因为 该 模式 提前 就 生成 了 所 有 的 进程 ,因而 避免 了 进程 过 
量 的 情况 。 


比 起 与 Preforking 类 似 的 线程 模式 ， 这 个 模式 的 一 个 优势 就 是 完全 隔 
离 。 因 为 每 个 进程 都 拥有 包括 Ruby 解 释 器 在 内 的 所 有 资源 的 副本 , 单 
个 进程 中 的 故障 不 会 影响 其 他 进程 。 因为 线程 共享 进程 资源 以 及 内 存 
空间 ， 单 线程 故障 可 能 会 无 法 预测 地 影响 到 其 他 线程 。 








Preforking 的 一 个 劣势 是 : 衍生 的 进程 越 多 ， 消 耗 的 内 存 也 越 多 。 进 
程 可 不 是 免费 的 午餐 。 考虑 到 每 个 衍生 的 进程 都 会 获得 所 有 资源 的 一 
份 副本 , 可 以 预料 到 每 一 次 进程 衍生 , 内 存 占 用 率 就 要 增加 100%( 以 
父 进 程 为 基准 )。 





按照 这 种 衍生 方式 ， 占 用 100MB 内 存 的 进程 在 衍生 出 4 个 子 进 程 之 后 
将 占用 500MB 内 存 。 即 便 这 样 ， 也 只 有 4 个 并 发 连接 。 


我 不 打算 在 这 里 就 这 一 点 再 唆 唆 不 休 了 , 不 过 这 种 模式 的 代码 的 确 简 
单 。 尽 管 需要 理解 几 个 概念 , 但 总 的 来 说 并 不 难 ， 也 不 用 担心 运行 期 
间 出 问题 。 


23.4 RHI 


O Unicorn 
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24.1 讲解 


线程 池 模 式 之 于 Preforking， 一 如 单 连接 线程 与 单 连 接 进 程 之 间 的 关 











系 。 同 Preforking 差 不 多 ,线程 池 在 服务 器 启动 后 会 生成 一 批 线程 ， 








将 处 理 连接 的 任务 交 给 独立 的 线程 来 完成 。 











个 染 构 的 处 理 流程 和 前 一 个 一 样 ， 只 需要 把 “进程 ” 改 成 “线程 ” 


B. A 


24.2 ”实现 


# ./code/ftp/arch/thread_pool. 


require 'socket' 
require 'thread' 
require_relative 


. ./command_handlLer ' 


module FTP 
Connection = Struct.new(:client) do 
CRLF 2 "NrNn" 
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rb 
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def gets 
client.gets(CCRLF) 
end 


def respond(message) 
client.write(message) 
client.write(CRLF) 
end 


def close 
client.close 
end 
end 


class ThreadPool 
CONCURRENCY = 25 


def initialize(port - 21) 
Gcontrol socket = TCPServer.new(port) 
trapC:INT) { exit } 

end 


def run 
Thread.abort on. exception = true 
threads = ThreadGroup.new 


CONCURRENCY.times do 
threads.add spawn. thread 
end 


Sleep 
end 


def spawn. thread 
Thread.new do 
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loop do 
conn = Connection.new(Gcontrol. socket.accept) 
conn.respond "220 OHAI" 


handler = CommandHandler.new(self) 


loop do 
request - conn.gets 


if request 
conn.respond handler.handle(request) 

else 
conn.close 
break 

end 

end 
end 
end 
end 
end 
end 


server = FTP::ThreadPool.new(4481) 
server.run 





这 里 再 次 出 现 了 两 个 方法 。 一 个 用 来 生成 线程 ， 另 一 个 用 来 封装 
线程 生成 以 及 线程 行为 。 因 为 这 里 用 到 了 线程 ， 所 以 还 要 使 用 


Connection 类 。 








HM 











€ ./code/ftp/arch/thread. pool.rb 
CONCURRENCY = 25 


def initialize(port - 21) 
Gcontrol socket = TCPServer.new(port) 
trapC:INT) { exit } 
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end 


def run 
Thread.abort on exception - true 
threads = ThreadGroup.new 


CONCURRENCY.times do 
threads.add spawn. thread 
end 


Sleep 
end 


这 个 方法 创建 了 一 个 ThreadGroup 跟 踪 所 有 的 线程 。 ThreadGroup 有 
点 像 一 个 可 对 线程 进行 操作 的 数组 (a thread-aware Array )。 你 可 以 向 
ThreadGroup 中 加 入 线程 ， 当 某 个 线程 成 员 执 行 结束 后 , 它 就 会 从 这 
个 组 中 丢弃 。 














你 可 以 使 用 ThreadGroup#1ist 获 得 组 中 当前 所 有 活动 线程 列表 。 在 
这 个 实现 中 ， 我 们 其 实 并 没有 用 到 这 个 技巧 ， 但 如 果 你 想 对 所 有 的 
活动 线程 进行 操作 (例如 使 用 join )， 那 么 ThreadGroup 就 能 派 上 用 
场 了 。 











同上 一 章 大 同 小 异 ， 我 们 依据 CONCURRENCY 的 值 多 次 调用 spanwn_ 
thread。 注 意 ， 这 里 CONCURRENCY 的 值 要 比 Preforking 中 的 高 。 这 还 
是 因为 线程 的 开销 更 小 ， 所 以 可 以 使 用 更 多 的 线程 。 要 记 住 的 是 MRI 
GIL 减 少 了 一 部 分 由 此 带 来 的 收益 。 














方法 的 最 后 调用 了 sleep 人 避免 退出 。 当 线程 池 中 的 线程 有 工作 任务 
时 ， 主 线程 保持 空闲 。 理 论 上 来 说 它 可 以 监视 线程 池 ， 不 过 这 里 只 是 
用 了 sleep 不 让 其 退出 。 








图 灵 社 区 会 员 Tiny9458 专 享 尊重 版 权 





24.3 


思考 | 129 
# ./code/ftp/arch/thread. pool.rb 
def spawn. thread 
Thread.new do 


loop do 


conn = Connection.new(Gcontrol. socket.accept) 
conn.respond "220 OHAI" 


handler = CommandHandler.new(self) 
loop do 


request - conn.gets 
if request 


conn.respond handler.handle(request) 
else 


conn.close 
break 
end 
end 
end 
end 
end 


Æ, 


这 个 方法 平淡 无 奇 ， 没 什么 出 彩 之 处 。 它 和 Preforking 一 样 。 生 成 一 
个 线程 





重复 执行 连接 处 理 代 码 。 同 样 由 内 核 确保 一 个 连接 只 能 由 单 
个 线程 接受 。 


24.3 思考 


有 关 线 程 池 模式 大 部 分 的 思考 内 容 同 前 一 个 模式 一 样 。 
除了 那些 线 和 











与 进程 








mi 


之 间 显 而 易 见 的 权衡 之 外 , 线程 池 模 式 不 需要 每 
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次 处 理 连接 时 都 生成 线程 , 也 没有 什么 令 人 抓 狂 的 锁 或 竞争 条 件 , 但 
却 仍 提供 了 并 行 处 理 能 


24.4 ”案例 


口 Puma 
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迄今 为 止 我 们 看 到 的 这 些 模式 其 实 都 是 串 行 化 模式 的 变 体 而 已 。 其 他 
几 种 模式 实际 上 使 用 的 结构 与 串 行 化 模式 相同 , 只 不 过 包装 了 线程 或 


者 进程 。 











事件 驱动 (Reactor ) 模式 采用 的 是 一 种 和 之 前 完全 不 同 的 方法 。 


25.1 讲解 
事件 驱动 模式 ( 基于 Reactor 模 式 ”) 如 今 可 谓 风头 正 劲 。 它 也 是 


EventMachine、Twisted，Node.js 以 及 Nginx 等 库 的 核心 所 在 。 


该 模式 结合 了 单线 程 和 单 进 程 , 它 至 少 可 以 达到 之 前 模式 所 能 提供 的 
并 行 操作 级 别 。 





它 以 一 个 中 央 连 接 复 用 器 ( 被 称 为 Reactor 核 心 ) 为 中 心 。 连 接生 命 周 
期 中 的 每 个 阶段 都 被 分 解 成 单个 的 事件 , 这 些 事 件 之 间 可 以 按照 任意 
的 次 序 交 错 并 处 理 。 连 接 的 不 同 阶段 只 是 可 能 的 IO 操作 而 已 : 








© 


http://en.wikipedia.org/wiki/Reactor pattern. 
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accept, read, write 以 及 close。 


中 央 复 用 顺 监 视 所 有 活动 连接 的 事件 ， 在 触发 事件 时 分 派 相 关 的 
代码 。 


下 面 是 事件 驱动 模式 的 工作 流程 : 
(1) 服务 器 监视 侦 听 套 接 字 ， 等 待 接 入 的 连接 ; 








(2) 将 接 入 的 新 连接 加 入 到 套 接 字 列 表 进 行 监视 ; 








(3) 服务 器 现在 要 监视 活动 连接 以 及 侦 听 套 接 字 ; 

(4) 当 某 个 活动 连接 可 读 时 ， 服 务 器 从 该 连接 读 取 一 块 数据 并 分 派 相 
关 的 回调 函数 ; 

(5) 当 某 个 活动 连接 仍然 可 读 时 ， 服 务 器 读 取 另 一 块 数据 并 再 次 分 派 
回调 函数 ; 








(6) 服务 器 收 到 男 一 个 新 连接 ， 将 其 加 入 套 接 字 列表 进行 监视 ; 











(7) 服务 器 注意 到 第 一 个 连接 已 经 可 以 写 人 ， 因 而 将 响应 信息 写 和 人 
连接 。 


S 


记 住 ， 所 有 的 一 切 都 发 生 在 单个 线程 中 。 注 意 ， 第 一 个 连接 仍 在 读 / 
写 过 程 时 ， 服 务 器 就 可 以 qccept 新 连接 了 。 








服务 器 将 每 次 操作 分 割 成 小 块 , 这 样 属于 多 个 连接 的 不 同事 件 就 可 以 
彼此 交错 了 。 


接 下 来 研究 实现 代码 。 
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25.2 ”实现 


X ./code/ftp/arch/evented.rb 
require 'socket' 
require. relative 


. ./command. handler" 


module FTP 
class Evented 
CHUNK SIZE- 1024 * 16 


class Connection 
CRLF = "NrNn" 
attr reader :client 


def initialize(io) 
Gclient = io 
Grequest, Gresponse = 
Ghandler = CommandHandler.new(self) 


"mn "n 
5 


respond "220 OHAI" 
on. writable 
end 


def on. data(data) 
Grequest «« data 


if Grequest.end with? (CRLF) 
# 完成 请 求 。 
response Ghandler.handle(Grequest) 
Grequest - "" 
end 
end 


def respond(message) 
Gresponse «« message + CRLF 
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# 立 即 加 载 可 以 写 入 的 任何 内 容 ， 
# 其 余部 分 将 在 下 次 套 接 字 可 写 入 时 重 试 。 
on. writable 

end 


def on writable 
bytes = client.write. nonblock(8response) 
Gresponse.slice!(0, bytes) 

end 


def monitor. for. reading? 
true 
end 


def monitor. for writing? 
!(Gresponse.empty?) 
end 
end 


def initialize(port - 21) 
Gcontrol socket = TCPServer.new(port) 
trapC:INT) { exit } 

end 


def run 
Ghandles = 11 


loop do 
to read = Ghandles.values.select(&:monitor. for. 
reading?).map(&:client) 
to write = Ghandles.values.select(&:monitor. for.. 
writing?).map(&:client) 


readables, writables = IO.select(to. read + [Gcontrol. 
Socket], to write) 


readables.each do lsocket|! 
if socket == Gcontrol. socket 
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io = @control_socket.accept 
connection- Connection.new(io) 
Ghandles[io.fileno] = connection 


else 
connection- Ghandles[socket.fileno] 


begin 
data = socket.read. nonblock(CHUNK SIZE) 
connection.on. data(data) 

rescue Errno: : EAGAIN 

rescue EOFError 
&handles.delete(socket.fileno) 

end 

end 
end 


writables.each do lsocketl 
connection- Ghandles[socket.fileno] 
connection.on. writable 

end 

end 
end 
end 
end 


server = FTP::Evented.new(4481) 
server.run 





这 个 实现 采用 了 一 种 同 之 前 那些 实现 不 同 的 手法 。 我 们 把 代码 分 解 成 
几 个 部 分 研究 。 


€ ./code/ftp/arch/evented.rb 
class Connection 


这 行 代码 定义 了 一 个 Connection 类 作为 事件 驱动 服务 器 。 
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有 件 驱 动 





在 前 面 几 个 线程 模式 的 示例 中 ， 我 们 用 Connection 类 保持 进程 间 的 
状态 隔离 。 这 个 示例 没有 用 线程 ， 为 什么 需要 Connection 类 呢 ? 


所 有 基于 进程 的 模式 都 使 用 进程 隔离 连接 。 不 管 利用 进程 的 方法 如 
何 , 它们 总 是 确保 无 论 何 时 都 由 单个 独立 的 进程 处 理 单个 连接 ,所 以 
每 个 连接 基本 上 都 是 由 一 个 进程 描述 。 




















事件 驱动 模式 用 的 是 单线 程 , 但 可 以 同时 处 理 多 个 用 户 连接 , 所 以 它 
需要 使 用 一 个 对 象 来 描述 每 个 独立 的 连接 , 这 样 就 不 会 破坏 连接 各 自 
的 状态 。 





# ./code/ftp/arch/evented.rb 
class Connection 
CRLF 2 "Ar^n" 
attr reader :client 


def initialize(io) 
Gclient = io 
Grequest, Gresponse = "", "" 
Ghandler = CommandHandler.new(self) 


respond "220 OHAI" 
on. writable 


Connection 类 的 开始 部 分 看 起 来 有 些 有 眼熟 。 


CO 量 中 ， 外 
界 可 以 通过 attr_accessor 对 其 进行 访问 。 





当 连 接 初 始 化 完毕 后 ， 它 会 像 从 前 一 样 获 得 自己 的 CommandHandler 
实例 。 随 后 它 写 入 FTP 所 要 求 的 定制 的 'hello' 响 应 。 不 过 并 非 直 接 写 
入 客户 端 连 接 ， 而 是 将 响应 的 主体 信息 写 人 @response 变 量 。 下 面 我 
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们 会 看 到 这 将 引发 Reactor 接 管 操作 并 将 数据 发 送 到 客户 端 。 


X ./code/ftp/arch/evented.rb 
def on. data(data) 
Grequest «« data 


if Grequest.end with? (CRLF) 
# 完成 请 求 
respond Ghandler.handle(Grequest) 
Grequest = "" 
end 
end 


def respond(message) 
Gresponse «« message + CRLF 


# 立即 加 载 可 以 写 入 的 任何 内 容 
E 其 余部 分 将 在 下 次 套 接 字 可 写 入 时 重 试 
on_writable 

end 


def on_writable 
bytes- client.write nonblock(Gresponse) 
Gresponse.slice!(0, bytes) 


Connection 的 这 部 分 定义 了 若干 与 Reactor 核 心 进 行 交 互 的 生命 周期 
例如 , 当 Reactor 从 客户 端 连接 读 取 数据 时 , 它 触 发 on_data 处 理 数据 。 


在 这 个 方法 的 内 部 ， 检 查 接收 到 的 是 否 是 一 个 完整 的 请 求 。 如 果 是 ， 
会 请 求 ehandler 建立 对 应 的 响应 并 将 其 赋 给 @response。 





当 客 户 端 连接 可 以 进行 写 人 时 就 调用 on_writable 方 法 。 这 就 要 和 
@response 变量 打交道 了 。 它 将 @response 中 的 内 容 写 人 客户 端 连 
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由 





FIKS) 





接 。 根 据 能 够 写 入 的 字 节 数 ， 将 成 功 写 人 的 数据 从 @response 中 
移 除 。 


这 样 ， 随 后 的 写 操 作 只 会 写 人 @response 中 本 次 没 能 写 入 的 部 分 内 
容 。 如 果 能 够 写 人 全 部 内 容 , 那么 @response 就 变 成 了 一 个 空 字符 
串 ， 就 无 法 再 进行 写 操作 了 。 





monitor_for_reading? 和 monitor_for_writing? 这 两 个 方法 被 
Reactor 用 来 查询 是 否 应 该 监视 特定 连接 的 读 写 状 态 。 在 本 例 中 , 只 要 
有 新 的 数据 ， 我 们 都 希望 进行 读 取 。 如 果 @response 有 内 容 可 写 ， 
我 们 希望 获知 可 以 进行 写 入 的 时 机 。 如 果 @response 中 没有 内 容 ， 
即便 是 客户 端 连接 可 以 写 人 ，Reactor 也 不 会 发 出 通知 。 














# ./code/ftp/arch/evented.rb 
def monitor_for_writing? 
! C@response . empty?) 
end 
end 


def initialize(port = 21) 
Gcontrol socket = TCPServer.new(port) 
trapC:INT) { exit } 


这 就 是 Reactor 核 心 的 主要 工作 。 


Ghandles 看 起 来 像 这 样 : [6 => #<FTP::Evented: :Connection: 
xyz123>} ， 其 中 键 对 应 的 是 文件 描述 符 编 号 ， 值 对 应 的 是 
Connection 对 象 。 





主 循环 的 第 一 行 查询 每 一 个 活动 连接 , 看 是 否 需要 使 用 之 前 介绍 的 生 
命 周 期 方法 对 其 进行 读 / 写 监 视 。 对 于 有 需要 的 连接 , 它 获 取 其 低层 IO 
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对 象 的 引用 。 





Reactor 随后 将 这 些 IO 实 例 传 给 不 带 超 时 参数 的 I0.setLect 。 
I0.select 会 一 直 阻 蹇 到 某 个 受 监 控 的 套 接 字 出 现 值得 关注 的 事件 
为 止 。 

注意 ，Reactor 还 会 监视 @control_socket 是 否 可 读 ， 以 便 检测 到 新 
接 入 的 客户 端 连接 。 

















# ./code/ftp/arch/evented.rb 
def run 
@handles = 11 


loop do 
to. read = €handles.values.select(&:monitor. for. reading?). 
map(&: client) 
to write = Ghandles.values.select(&:monitor. for.. 
writing?).map(&:client) 


readables, writables = IO.select(to read + [Gcontrol. 
Socket], to write) 


readables.each do |socket| 
if socket == Gcontrol. socket 
= Gcontrol. socket.accept 
connection- Connection.new(io) 
ehandles[io.fileno] = connection 


else 
connection- Ghandles[socket.fileno] 


begin 
data = socket.read. nonblock(CHUNK SIZE) 
connection.on. data(data) 

rescue Errno: : EAGAIN 

rescue EOFError 
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Reactor 的 这 部 分 代码 根据 它 从 I0.select 中 接收 到 的 事件 触发 对 应 
的 方法 。 





它 首先 处 理 可 读 的 套 接 字 。 如 果 @control_socket 可 读 ， 就 意味 着 
出 现 了 一 个 新 的 客户 端 连 接 。Reactor 调 用 accept 接 受 连 接 ， 建 立 一 
个 新 的 Connection 并 将 其 放 入 @handles 散 列 中 ， 这 样 就 可 以 在 下 
一 轮 循环 中 进行 监视 了 。 

















接 下 来 要 处 理 可 读 的 套 接 字 是 普通 的 客户 端 连 接 的 情况 。 在 这 种 情况 
下 ， 代 码 会 尝试 读 取 数据 ， 触 发 对 应 Connection 的 on_data 方 法 。 
如 果 读 操作 出 现 阻塞 (Errno: :EAGAIN )， 不 做 特殊 处 理 ， 让 事件 落 

空 即 可 。 如 果 客 户 端 断 开 连 接 ( EOFError ), 那么 要 确保 从 @handles 
散 列 中 删除 相应 的 条 目 ， 使 得 对 应 的 对 象 可 以 被 回收 并 不 再 受到 
监视 。 








代码 最 后 一 部 分 通过 触发 对 应 Connection 的 on_writable 方 法 处 理 
可 写 的 套 接 字 。 





25.3 思考 








事件 驱动 模式 同 其 他 模式 有 着 显著 的 不 同 , 因而 也 就 产生 了 尤为 不 同 
的 优势 和 劣势 。 

首先 , 该 模式 以 极 高 的 并 发 处 理 能 力 而 闻名 ， luas AE 的 并 
发 连接 。 光 这 一 点 就 让 其 他 模式 无 法 望 其 项 背 ， 因 为 它们 都 受到 进 
程 /线程 数量 的 限制 。 











如 果 服 务 器 需要 生成 5000 个 线程 来 处 理 5000 个 连接 , 服务 右 估 计 会 不 
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堪 重 负 。 就 处 理 并 发 连接 而 言 ， 事 件 驱 动 模式 可 请 一 校 独 秀 并 广 为 
流传 。 


它 主 要 的 劣势 是 所 施加 的 编程 模型 。 一 方面 这 个 模型 更 简单 ， 因 为 无 
需 处 理 众 多 进程 /线程 。 这 意味 着 就 不 存在 共享 内 存 、 同 步 、 越 界 进 
程 ， 等 等 。 但 是 考虑 到 所 有 的 并 发 都 发 生 在 单个 线程 内 部 ， 有 一 条 非 
常 重要 的 规则 必须 遵循 ， 那 就 是 绝 不 能 阻塞 Reactor。 











要 诠释 这 一 点 ， 让 我 们 来 仔细 查看 一 下 实现 代码 。 在 CommandHandler 
类 中 ， 当 处 理 FTP 文 件 传输 命令 (RETR) 时 ， 它 实际 上 打开 了 一 个 套 
接 字 ， 以 流 的 方式 发 送 数据 ,然后 关闭 套 接 字 。 重 要 的 是 这 个 套 接 字 
是 在 Reactor 主 循环 之 外 使 用 的 ，Reactor 对 其 一 无 所 知 。 











假设 客户 端 在 一 条 速度 缓慢 的 连接 上 请 求 文件 传输 。 这 会 对 Reactor 
造成 怎样 的 影响 ? 





考虑 到 一 切 都 运行 在 同一 个 线程 之 内 , 单个 迟缓 的 客户 端 连 接 会 阻塞 
住 整 个 Reactor! 当 Reactor 在 Connecton 上 触发 某 个 方法 时 ，Reactor 
会 一 直 阻 塞 到 该 方法 返回 为 止 。 由 于 on_data 方 法 委派 ( delegate ) 给 
T CommandHandler , 当 它 以 数据 流 的 方式 向 客户 端 进行 文件 传输 时 ， 
Reactor 一 直 处 于 阻塞 。 在 这 期 间 , 无 法 读 取 其 他 数据 ,也 无 法 接受 着 
的 连接 。 

















应 用 程序 需要 达成 的 任何 事情 都 应 该 快速 完成 , 这 一 点 非常 重要 。 那 
我 们 应 该 怎样 使 用 Reactor 处 理 缓慢 的 连接 呢 ? 利用 Reactor 自 身 ! 





如 果 你 采用 该 模式 , 那 就 需要 确保 所 有 阻塞 式 IO 都 由 Reactor 自 己 来 处 
理 。 在 这 个 例子 中 就 意味 着 由 CommandHandler 所 使 用 的 套 接 字 需 要 
被 封装 到 Connection 的 子 类 中 ， 它 定义 了 自己 的 一 套 on_data 和 
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on_writable 方 法 。 


当 Reactor 可 以 向 缓慢 的 连接 中 写 和 人 数据 时 ， 它 会 触发 相应 的 
on_writable 方 法 , 该 方法 能 够 在 没有 阻塞 的 情况 下 尽 可 能 多 的 向 客 
户 端 写 入 数据 。 这 样 Reactor 就 可 以 在 等 待 这 个 缓慢 的 远程 连接 的 同时 
继续 处 理 其 他 连接 , 一 旦 那 条 远程 连接 再 次 可 用 , 仍 可 对 其 进行 处 理 。 














简 而 言 之 , 事件 驱动 模式 提供 了 一 些 显而易见 的 优势 , 真正 简化 了 套 
接 字 编程 的 某 些 方面 。 另 一 方面 , 它 需要 你 重新 考虑 自己 的 应 用 程序 
中 所 涉及 的 全 部 IO 操作 。 该 模式 所 带 来 的 益处 很 容易 就 会 被 一 些 迟 钝 
的 代码 或 者 含有 阻塞 式 IO 的 第 三 方 代码 库 搞 得 烟消云散 。 























25.4 ”案例 


口 EventMachine 
ū Celluloid::IO 
O Twisted 
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混合 模式 





这 是 本 书 有 关 网 络 模式 的 最 后 一 部 分 。 这 部 分 并 不 涉及 特定 的 模式 本 
身 ， 而 是 阐述 一 个 混合 模式 的 概念 ， 它 采用 了 若干 个 之 前 学 习 过 的 
模式 。 

尽管 这 些 体系 都 可 以 应 用 到 任何 类 型 的 服务 中 (在 之 前 的 章节 中 用 的 
是 FTP ), 但 如 今 大 量 的 注意 力 都 投 回 了 HTTP 服 务 器 。 鉴 于 Web 的 广 
ZRI, 这 倒是 也 毫 不 意外 。Ruby 社 区 冲锋 在 Web 运 动 的 前 线 , 在 各 
类 HTTP 服 务 器 中 占有 相当 的 份额 。 因 此 我 们 在 这 一 章 中 看 到 的 真实 
案例 全 都 是 HTTP 服 务 器 。 


让 我 们 来 看 一 些 例子 吧 。 
26.1 nginx 


nginx 项 目 "提供 了 一 个 用 C 语 言 编 写 的 性 能 极 高 的 网 络 服务 器 ， 项 目 
网 站 上 宣称 它 能 够 在 单 服务 器 上 服务 100 万 个 并 发 请 求 。nginx 在 Ruby 





(D http://nginx.org. 
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世界 中 多 作为 Web 应 用 服务 器 前 端的 HTTP 代 理 ， 不 过 它 也 能 够 处 理 
HTTP，SMTP 等 协议 。 

nginx 是 如 何 实现 如 此 高 的 并 发 的 呢 ? 


在 核心 部 分 了”, nginx 使 用 了 Preforking 模 式 , 但 是 在 每 个 衍生 进程 中 使 
用 的 却 是 事件 驱动 模式 。 作 为 一 个 高 性 能 的 网 络 服务 器 , 这 种 选择 意 
义 重 大 ， 原 因 如 下 。 





首先 ， 在 nginx 衍 生子 进程 时 ， 所 有 的 相关 成 本 在 启动 时 就 已 经 付出 
了 。 这 就 保证 了 ngnix 能 够 最 大 限度 地 利用 多 核 以 及 服务 需 资源 。 其 
次 ， 事 件 驱 动 模式 也 贡献 了 一 臂 之 力 ， 它 不 进行 任何 生成 (spawn )， 
也 不 使 用 线程 。 使 用 线程 的 一 个 问题 就 是 需要 由 内 核 承担 所 有 活动 进 
程 的 管理 以 及 上 下 文 切换 所 带 来 的 开销 。 











ngnix 疾 如 内 电 的 运行 速度 少不了 其 他 一 干 特性 的 协助 ， 这 包括 的 严 
密 的 内 存 管理 ( 只 能 利用 C 语 言 实现 ), 但 在 核心 部 分 , 它 混合 使 用 了 
前 面 几 章 介绍 的 模式 。 


26.2 Puma 


Puma rubygem 提 供 了 一 个 “专注 于 并 发 的 Ruby Web 服 务 器 ”。 “Puma 
被 设计 作为 由 Ruby 实 现 的 王牌 HTTP 服 务 器 ， 由 于 它 大 量 倚 重 线程 ， 
所 以 并 没有 使 用 GIL ( Rubinius 或 JRuby )。Puma 的 自述 文件 ?对 于 其 











(D http://www.aosabook.org/en/nginx.html. 
@ http:/puma.io. 
@) https://github.com/puma/puma#description. 
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适用 场景 给 出 了 很 好 的 概述 ， 并 提 及 了 GIL 对 于 线程 化 的 影响 。 





那么 Puma 是 如 何 实现 并 发 的 呢 ? 


在 高 层 上 ，Puma 利 用 线程 池 提 供 并 发 。 主 线程 一 直 用 于 aqccept 新 的 
连接 ， 然 后 将 连接 加 入 线程 池 待 作 处 理 。 这 便 是 不 适用 keep-alive 的 
HTTP 连 接 的 处 理 方 法 。 不 过 Puma 也 支持 HTTP 的 keep-alive。 在 处 理 
连接 时 ， 如 果 首 个 请 求 要 求 连接 保持 活跃 状态 ， 那 么 Puma 会 尊重 这 
一 请 求 ， 不 关闭 连接 。 











不 过 这 时 Puma 就 不 再 只 是 qccept 这 个 连接 了 。 它 需要 监视 该 连接 上 
的 新 请 求 并 进行 处 理 。 这 是 通过 事件 驱动 类 型 的 reactor 实 现 的 。 当 新 
的 请 求 出 现在 处 于 保持 活跃 状态 的 连接 上 时 , 该 请 求 会 被 再 次 加 入 线 
程 池 进 行 处 理 。 








Puma 的 请 求 处 理 总 是 由 线程 池 完 成 的 。 它 通过 一 个 能 够 监视 所 有 持 
久 连 接 的 Reactor 实 现 。 











Puma 同 样 包括 了 其 他 方面 的 精心 优化 ， 但 其 核心 同样 也 是 采用 了 多 
个 前 面 几 章 介绍 的 模式 。 


26.3 EventMachine 
EventMachine 是 Ruby 圈 里 知名 的 事件 驱动 IO 库 。 它 利用 Reactor 模 式 提 


供 高 稳定 性 及 可 扩展 性 。 EventMachine 是 用 Ci 语言 编写 的 , 但 是 通过 C 
扩展 的 形式 提供 了 Ruby 接 口 。 














(D http://en.wikipedia.org/wiki/HTTP_persistent_connection. 
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那么 EventMachine 是 如 何 实 现 并 发 的 呢 ? 


EventMachine 的 核心 是 利用 事件 驱动 模式 实现 的 。 它 是 一 个 单线 程 的 
事件 循环 ， 可 以 处 理 多 个 并 发 连接 上 的 网 络 事 件 。EventMachine 也 提 
供 了 一 个 线程 池 , 用 于 推迟 处 理会 拖累 Reactor 的 那些 耗 时 或 阻塞 式 的 
操作 。 





EventMachine 支 持 包括 监视 生成 进程 、 网 络 协议 实现 等 大 量 特 性 。 利 
用 多 种 架构 只 是 它 实 现 并 发 性 的 一 种 手段 。 
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我 确信 你 现在 已 经 掌握 了 有 关 套 接 字 编程 基础 及 其 扩展 内 容 。 你 可 以 
将 它们 应 用 于 Ruby 以 及 其 他 编程 领域 。 这 些 都 是 非常 有 用 的 知识 。 








感谢 你 阅读 本 书 。 希望 它 能 帮 你 更 深入 地 理解 工作 中 用 到 的 技术 。 我 
的 电子 邮件 是 jesse@jstorimer.com， 我 非常 乐意 与 你 就 本 书 或 是 任何 
相关 的 编程 话题 进行 交流 。 
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“我 用 Ruby 做 网 络 编程 好 几 年 了 ， 但 仍 从 这 本 书 中 学 到 很 多 新 知识 。?” 
“使 用 TCP Sockets 的 程序 员 和 对 它 感 兴趣 的 人 最 好 都 读 读 这 本 书 。” 


你 知道 Web 服 务 器 如 何 打开 套 接 字 并 绑 定 到 地 址 以 及 如 何 接受 连接 
吗 ? 作者 在 深入 理解 网 络 协议 栈 的 工作 机 制 之 前 ， 就 做 过 大 量 Web 
编程 。 所 以 放下 手中 那 本 1000 多 页 的 网 络 手 册 吧 ! 本 书 旨 在 为 开发 
人 员 介绍 套 接 字 编 程 的 方方面面 。 读 完 这 本 书后 ， 你 就 会 理解 套 接 
字 编 程 的 必 备 知识 ， 能 够 编写 服务 器 /客户 端 库 以 及 并 发 网 络 程序 。 


本 书 中 所 有 的 代码 均 使 用 Ruby 编 写 ， 但 书 中 所 讲述 的 内 容 并 不 仅 限 
于 Ruby。Berkeley 套 接 字 API 有 超过 25 年 的 应 用 历史 ， 与 所 有 的 现 
代 编 程 语言 有 着 紧密 的 联系 。 当 使 用 Python、Go、C 或 其 他 编程 语 
言 时 ， 这 里 所 学 的 知识 同样 适用 。 本 书 介绍 的 都 是 网 络 编程 的 必 备 
知识 ， 你 必然 可 以 从 中 受益 良 多 。 


主要 内 容 包括 : 

服务 器 和 客户 端的 生命 周期 ; 

使 用 Ruby 在 合适 的 时 机 ， 以 各 种 方式 读 取 并 写 入 数据 ; 
提高 套 接 字 性 能 的 一 些 方 法 ; 

SSL 套 接 字 基 础 知识 ; 

实现 并 发 网 络 的 6 种 架构 模式 ; 

连接 复 用 、 非 阻塞 IO、 套 接 字 超 时 和 套 接 字 选项 ， 等 等 。 
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最 前 沿 的 IT 类 电子 书 发 售 平台 

电子 出 版 的 时 代 已 经 来 临 。 在 许多 出 版 界 同行 还 在 狂 图 灵 社 区 进一步 把 传统 出 版 流程 与 电子 书 出 版 业务 
耶 簿 律 的 时 候 ， 图 灵 社区 已 经 采取 实际 行动 拥抱 这 个 紧密 结合 ， 目 前 已 实现 作 译 者 网 上 交 稿 、 编 辑 网 上 
出 版 业 巨 变 。 作 为 国内 第 一 家 发 售 电子 图 书 的 IT 类 出 审 稿 、 按 音 发 布 的 电子 出 版 模式 。 这 种 新 的 出 版 模 
版 商 ， 图 灵 社 区 目前 为 读者 提供 两 种 DRM-free 的 阅读 。 。” 式 ， 我 们 称 之 为 “敏捷 出 版 ”， 它 可 以 让 读者 以 较 
体 

















验 : 在 线 阅读 和 PDF。 快 的 速度 了 解 到 国外 最 新 技术 图 书 的 内 容 ， 弥 补 以 
et T S 往 翻 译 版 技术 书 “ 出 版 即 过 时 ”的 缺憾 。 同 时 ， 敏 
GAUN, ETERAHZRENAA EPRE — 捷 册 版 全 得 作 、 译 、 编 、 读 的 交流 更 为 方便 ， 可 以 
更 新 容易 ， 而 且 尽 可 能 采用 了 彩色 图 片 (即使 Qs ee nun m ides 

: 提前 消灭 书稿 中 的 错误 ， 最 大 程度 地 保证 图 书 出 版 
的 书 纸 质 版 是 黑白 印刷 的 ) 。 读 者 还 可 以 方便 地 进 ids e PR 
Bd. MN HATE. H 
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最 方便 的 开放 出 版 平台 最 直接 的 读者 交流 平台 
































































































































































































































图 灵 社区 向 读者 开放 在 线 写 作 功 能 ， 协 助 你 实现 自 出 在 图 灵 社 区 ， 你 可 以 十 分 方便 地 写作 文章 、 提 交 勘 
版 和 开源 出 版 的 梦想 。 利 用 “合集 ”功能 ， 你 就 能 联 误 、 发 表 评 论 ， 以 各 种 方式 与 作 译 者 、 编 辑 人 员 和 
合 二 三 好 友 共同 创作 一 部 技术 参考 书 ， 以 免费 或 收费 其 他 读者 进行 交流 互动 。 提 交 勘 误 还 能 够 获 赠 社区 
的 形式 提供 给 读者 。 (收费 形式 须 经 过 图 灵 社 区 立项 银子 。 

评审 。) 这 极 大 地 降低 了 出 版 的 门槛 。 只 要 你 有 写作 

的 意愿， 图 灵 社 区 就 能 帮助 你 实现 这 个 梦想 。 成 熟 的 ”你 避 以 积极 参 己 社区 经 常 开展 的 访谈 、 审 污 、 评 园 
书稿 ， 有 机 会 入 选 出 版 计划 ， 同 时 出 版 纸 质 书 。 等 多 种 活动 ， 赢 取 积 分 和 银子 ， 积 累 个 人 声望 。 
图 灵 社 区 引进 出 版 的 外 文 图 书 ， 都 将 在 立项 后 马上 在 

社区 公布 。 如 果 你 有 意 翻 译 哪 本 图 书 ， 欢 迎 你 来 社区 












































请 。 只 要 你 通过 试 译 的 考验 ， 即 可 签约 成 为 图 灵 的 
译 者 。 当 然 ， 要 想 成 功 地 完成 一 本 书 的 翻译 工作 ， 是 
需要 有 坚强 的 狼 力 的 。 
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